You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
한 줄 요약: 60초 야외 녹음을 5초씩 잘라서 234종의 새/개구리/곤충을 맞추는 multi-label 분류. macro-averaged ROC-AUC.
핵심 난관: Code Competition이라 Kaggle 노트북에서만 제출 가능. CPU 90분 제한. 자체 파이프라인이 전부 실패하고 공개노트북 fork로 첫 제출 성공.
실험 흐름
Trial
왜 시도했나
결과
다음엔
001~003 자체 파이프라인
Perch v2 임베딩(1536차원)을 뽑아서 LightGBM/XGBoost에 넣으면 될 것
로컬 val AUC 0.97까지 올랐지만 Kaggle 제출 16번 연속 실패 (경로, GPU 제한, TF 버전, timeout 등)
자체 파이프라인 포기. 검증된 공개 노트북 fork
004 LR+PCA64
Discussion에서 LR이 XGBoost보다 좋다는 걸 발견
val 0.9754 (XGBoost 0.9580보다 좋음). 41초 완료
공개 노트북도 LR 사용 확인
005 PCA sweep
PCA 차원(64~1536)에 따른 XGBoost 성능 비교
no PCA(0.9580)가 best이지만 LR+PCA64(0.9754)가 전부 이김
XGBoost는 버리고 LR로 통일
007 공개노트북 fork
0.912 공개노트북(Perch logits 직접 매핑 + Bayesian prior + LR probe + Gaussian smoothing) fork
Public 0.912 — 첫 유효 제출!
post-processing 추가로 0.916+ 노려볼 것
008 post-processing
temperature scaling(새=1.10, 개구리/곤충=0.95) + file-level/rank-aware scaling 추가
re-run 중 (TBD)
OOF 검증 없이 제출 — 반성 포인트
16번의 노트북 삽질 (v1 → v16)
문제 유형
버전
뭐가 터졌나
경로
v1~v4
인터넷 차단(URL 불가), 대회 데이터 경로(/competitions/ 필요), 모델 마운트 경로
코드
v5~v7
변수명 불일치, try-except가 에러 삼킴
성능
v8~v9
CPU XGBoost 230종 학습 timeout, gpu_hist 폐지
환경
v10~v12
test 파일 0개(commit 단계), GPU 제출 불가(GPU max=0분)
TF
v13~v14
TFLite 변환 불안정, Perch v2_cpu가 TF 2.20 필요(기본 2.19)
의존성
v15
TF wheel이 dataset 아닌 kernel_sources로 마운트
성공
v16
0.912 fork + TF 2.20 wheel + perch-meta 캐시 = 성공
교훈: Code Competition에서 삽질하지 않으려면 검증된 공개 노트북을 fork하고, 거기에 개선점을 얹어라. 처음부터 만들면 환경 차이만으로 일주일 날린다.
제출 기록
sub
trial
public
왜 이 결과가 나왔나
01
007 fork
0.912
Perch logits(14,795종→234종 매핑) + site×hour Bayesian prior + LR probe. 공개 노트북과 동일
02
008 post-processing
TBD
temperature/file-level/rank-aware scaling 추가. OOF 미검증 상태로 제출
churn (Playground S6E3)
한 줄 요약: 통신사 고객이 이탈할지 예측. AUC-ROC (높을수록 좋음, 최대 1.0). 4,142팀 참가.
핵심 난관: 상위권이 전부 0.914~0.917에 몰려있어서 0.001이 수십 등수 차이. 로컬 GBDT 한계를 Kaggle 노트북 fork(RealMLP)로 돌파.
최종 성적: Best public 0.91707, Best private 0.91815. 17회 제출, 84+ trials.