Designing Machine Learning Systems (λ¨Έμ λ¬λ μμ€ν μ€κ³)
λνμμμ κ²½ννλ λ₯λ¬λ λͺ¨λΈ κ°λ°μ μ€λ¬΄μ μΈ λΆλΆλ³΄λ€λ μ무λλ νμ μ μΈ λΆλΆμ μ΄μ μ΄ λ§μΆ°μ Έ μλ€. μ§κΈμ μ§μ₯μμ λ₯λ¬λ λͺ¨λΈμ κ°λ°νλ©° μ¬λ¬ μ€λ¬΄μ μΈ κ²½νμ νκ³ μμ§λ§, μ‘°κΈ λ κ·Όμμ μΈ κ³΅λΆλ₯Ό ν΄λ³΄λ©΄ μ’μ§ μμκΉλΌλ μκ°μ μΉ© νμμ "Designing Machine Learning Systems (λ¨Έμ λ¬λ μμ€ν μ€κ³)"λΌλ μ± μ ꡬ맀νλ€. λ₯λ¬λ λΆμΌμ κ²½μ° μ΅κ·Ό λͺ λ κ°μ λ°μ μ΄ λ§μκΈ° λλ¬Έμ κ΄λ ¨ μμ μ ꡬ맀ν λ μ΄ν λ°νμΌμ λ³΄κ² λλλ°, μ΄ μ± μ μ΄ν 1μ λ°νμ΄ 2023λ 3μμ΄λΌ κ΅μ₯ν μ΅κ·Όμ μ± μ΄λ€.
μ μ - μΉ© νμ
μΉ© νμμ ν΄λ μ΄νΏ AIμ 곡λ 창립μμ΄μ CEOμ΄λ©° μλΉλμ, μ€λ Έν΄ AI, λ·νλ¦μ€μ μ¬μ§νλ©° λ¨Έμ λ¬λ μμ€ν μ κ°λ°ν΄μλ€. μ€ν νΌλ νλΆμμΌ λλ 'λ₯λ¬λ μ°κ΅¬λ₯Ό μν ν μνλ‘'λΌλ κ°μλ‘ νμλ€μ μ§μ κ°λ₯΄μ³€κ³ , νμ¬λ μ΄ μ± μ ν λκ° λ 'CS 329S: λ¨Έμ λ¬λ μμ€ν μ€κ³(Machine Learning Systems Design)λ₯Ό κ°μνκ³ μλ€κ³ νλ€. μ΄λ ₯μ΄ μμ£Ό κ΅΅μ§ κ΅΅μ§νλ€...
μ± κ°λ¨ μ€λͺ
μ΄ μ± μ MLμ νμ©ν΄ μ€μ λ¬Έμ λ₯Ό ν΄κ²°νλ €λ μ¬λμ μν μ± μ΄λ©° λκ·λͺ¨ ML μμ€ν μ μ€μ μ λκ³ μ€λͺ νλ€. μ± μμμ MLμ λ₯λ¬λκ³Ό κ³ μ μ μΈ μκ³ λ¦¬μ¦μ λͺ¨λ μλ―Ένλ€. λ¨Έμ λ¬λ μμ€ν μ κ°μλΆν° λ°μ΄ν° μμ§λμ΄λ§, νΌμ² μμ§λμ΄λ§, λͺ¨λΈ κ°λ°/λ°°ν¬, νλ‘λμ νκ²½μμμ λͺ¨λΈ ν μ€νΈ, MLOps λ± κ΅μ₯ν ν¬κ΄μ μΈ κ°λ μ λ€λ£¬λ€. λλ¬Έμ λ¨Έμ λ¬λ μμ€ν μ μ λ°μ μΌλ‘ μ΄ν΄νκ³ μμΌλ‘ λ΄κ° μ΄λ€ κ²μ λ 곡λΆνλ©΄ μ’μμ§ κ°μ μ‘λ λ° λμμ΄ λ λ§ν μ± μ΄λ€.
νκ³μμλ μ£Όλ‘ λ₯λ¬λ λͺ¨λΈ μ체λ νμ΅ λ°©λ²λ‘ λλ νΉμ λλ©μΈ(CV, NLP,...)μ μκ³ λ¦¬μ¦μ λν μ°κ΅¬κ° μ£Όλ₯Ό μ΄λ£¬λ€. νμ§λ§ MLμ νλ‘λμ νκ²½μ μ μ©νκΈ° μν΄μλ λͺ¨λΈ μ¨λΌμΈ ν μ€νΈ, λ°μ΄ν° μ²λ¦¬, μλ², μμ κ΄λ¦¬, μν¬ νλ‘ λ± μ λ§ λ€μν κ²λ€μ΄ νμνλ€. λν νκ³μμλ μ£Όμ΄μ§ λ°μ΄ν°μ μμμ μ±λ₯μ λμ΄λ κ²μ μ΄μ μ λ§μΆμ§λ§, νλ‘λμ νκ²½μμλ μ§μμ μΌλ‘ λ³ννλ μ λ ₯ λ°μ΄ν°μμλ μ±λ₯μ μ μ§νλ κ²μ΄ μ€μνλ€. λλ¬Έμ μ΄ μ± μ νλ‘λμ νκ²½μμ μ λ’°μ± μλ ML λͺ¨λΈμ λ§λ€κΈ° μν λ°©λ²μ λν μ€λͺ λ ν¬ν¨νλ€.
λλ μ
νκ³μμλ μ±λ₯ 1%λ₯Ό λμ΄κΈ° μν΄ λ Έλ ₯νλ κ²μ΄ κ°μΉ μλ μΌμ΄μ§λ§, νλ‘λμ νκ²½μμλ ML μ±λ₯ μ§ν보λ€λ λΉμ¦λμ€ μ§νκ° λ μ€μνλ€λ λ§μ΄ κ΅μ₯ν μλΏμλ€. κΈ°μ μμμ ML λͺ¨λΈμ μΆμ² μμ€ν μ΄λ λ΄λΆ νλ‘μΈμ€ μλνλ₯Ό μν λ₯λ¬λ λͺ¨λΈμ΄λ μ±λ΄κ³Ό κ°μ μμ±ν λͺ¨λΈμ΄λ κ²°κ΅ νΉμ λΉμ¦λμ€ μ§νλ₯Ό ν₯μμν€λ κ²μ΄ λͺ©νμ΄λ€. λλ¬Έμ νκ³μμλ μ€μν μ±λ₯ 1~2% μ°¨μ΄κ° νλ‘λμ νκ²½μμλ ν¬κ² μ€μνμ§ μμ μ μλ€. νμ§λ§ ML λͺ¨λΈμ μ¬μ©ν΄μ λΉμ¦λμ€ μ§νλ₯Ό ν₯μμν€λ κ²μ μλΉν μ€μν μΌμ΄λ€.
λͺ¨λΈ κ°λ° μμλ νΉμ μμ λ§λ€μ SOTA(State-Of-The-Art) λͺ¨λΈμ΄ κ°μ₯ μ’μ μ±λ₯μ λ΄μ§ μλλ€λ λ§λ 곡κ°μ΄ κ°λ€. 리λ보λμμμ SOTA λͺ¨λΈμ ν΄λΉ μκ·λͺ¨μ λ°μ΄ν°μ μμμ μ±λ₯μ΄ μ’μ κ²μΌ λΏ λͺ¨λ λ°μ΄ν°μμ μ’μ μ±λ₯μ λ΄λ κ²μ μ λ μλλ€. λλ¬Έμ ML μμ§λμ΄μκ² μ’μ λͺ¨λΈμ μ ννλ μΌμ΄λΌλ κ²μ μΈμ λ κΉλ€λ‘μ΄ μΌμΈ κ² κ°λ€.
λ¨Έμ λ¬λ μμ€ν μ μ΄λ£¨λ μΈνλΌμ μΈ λ΄μ©κ³Ό MLOps κ΄μ μ μ΄μΌκΈ°λ μ’μ λ΄μ©μ΄ λ§μλ€. λ¨Έμ λ¬λ κ΄λ ¨ μ 무λ₯Ό μννλ€ λ³΄λ©΄ λκ»΄μ§λ κ²λ€μ κ΅μ₯ν μ μ 리ν μ± μ΄λΌλ μκ°μ΄ λ€μ΄μ μ’μλ€.
νμ§λ§, μ± μ νμ΄μ§λ₯Ό μ±μ°κΈ° μν μ±ν°κ° κ°κ°μ΄ μ‘΄μ¬νκΈ΄ νλ€. ν루λ λ±μ λͺ¨λΈ μμΆ λ°©λ²μ μ€λͺ νκ±°λ νΌμ² μμ§λμ΄λ§ κΈ°λ²λ€μ νλνλ μ€λͺ νλ λΆλΆλ€μ΄ μλ€. λν μ£Όλ‘ μμΈ‘ μμ€ν , μΆμ² μμ€ν λ±μ λ¨Έμ λ¬λ λͺ¨λΈ κ°λ°μ μ΄μ μ΄ λ§μΆ°μ Έ μλ€. λλ¬Έμ μ»΄ν¨ν°λΉμ μ΄λ μμ°μ΄μ²λ¦¬ μμ§λμ΄μκ² λΆνμν λ΄μ©λ λ§μΌλ μ±ν°λ³λ‘ μ λ³ν΄μ μ½μ΄λ³΄λ κ² μ’μ κ² κ°λ€.
μ΄ μ± μ λ€ μ½λλ€κ³ λ¨Έμ λ¬λ μμ€ν μ μ€κ³νλ λ°©λ²μ ν°λν μλ μλ€. λ¨Έμ λ¬λ μμ€ν μ€κ³μ λν κ°λ‘ κ°μ μ±κ²©μ μ± μ΄κΈ° λλ¬Έμ, μ‘°κΈ λ κΉκ² 곡λΆνκ³ μΆμ μ£Όμ μ λ°©ν₯μ μ°Ύλ μ©λλ‘ μκ°νλ κ²μ΄ μ’μ κ² κ°λ€.
μΆμ² λ μ
μ΄λ μ°¨ AI/ML/CV/NLP μμ§λμ΄μ Data Scientist, AI Researcher μ§κ΅°μκ² μΆμ²νλ©° κ΄λ ¨ μμ§λμ΄λ₯Ό ν¬λ§νλ νμλ€λ μ½μ΄λ³΄λ©΄ μ’μ κ² κ°λ€. λμΌν μ§μ μ²λΌ 보μ¬λ κΈ°μ λ§λ€ μμ§λμ΄μ μ 무 λ²μκ° λ€λ₯΄μ§λ§, researcherλΌ λΆλ₯΄λ μ§κ΅° λν μ¨μ ν μ°κ΅¬μλ§ μ§μ€νλ κ²½μ°λ νμΉ μκΈ°μ μ΄ μ± μ μ½μ΄λ³΄λ κ²μ΄ λμμ΄ λλ¦¬λΌ μκ°νλ€.
μ΄μ λ§ λ¨Έμ λ¬λμ λ°°μ°κ³ μλ μ¬λμκ²λ μΆμ²νμ§ μλλ€. μ΄λ μ λ λ¨Έμ λ¬λμ λν μ΄ν΄κ° μκ³ λͺ¨λΈμ κ°λ°ν΄λ³Έ κ²½νμ΄ μμ΄μΌ λμμ΄ λλ λ΄μ©μ΄ λ§κΈ° λλ¬Έμ΄λ€.