● 생성형 인공지능/리포트

생성형 AI의 진화 단계별 정리 (주요 회사별 AI 모델 소개 등)

0ver-grow 2025. 4. 9. 13:13
반응형
  • 생성형 AI는 지난 2년 동안 프롬프트 엔지니어링과 명령어 미세 조정에서 시작해 챗봇 답변의 정확성을 높이기 위해 외부 지식 소스를 통합하는 방향으로 빠르게 발전해 왔다.

 

  • AI 모델의 진화
    • ① 머신러닝 딥러닝
      • 개발자가 규칙을 정하거나 데이터 정리를 진행
      • 예를 들어, 고객 문의를 분류하려면 "긍정"과 "부정" 태그를 일일이 붙여야 했죠.
    • ② 언어지능(LLM (Large Language Model))
      • ⓐ 대규모 언어 모델 ( LLM )은 언어 생성과 같은 자연어 처리 작업을 위해 설계된 머신 러닝 모델의 한 유형
        • LLM은 많은 매개변수가 있는 언어 모델이며 방대한 양의 텍스트에 대한 자체 감독 학습 으로 훈련되어 인간의 언어를 이해하고 답변을 생성하는 AI모델
        • LLM은 패턴 학습으로 작동합니다. 인터넷 기사, 책, 논문, 소셜 미디어 등 방대한 데이터를 스스로 분석하며 규칙이나 라벨 없이도 언어의 맥락과 의미를 이해  
          • 예를 들어, "저는 매일 아침 책을 읽습니다"라는 문장을 반복해서 보면 "매일" 다음에 "아침"이 자주 오고, "읽습니다"가 행동을 뜻한다는 걸 스스로 터득하는 셈이죠. 그 결과 자연스럽게 맥락과 의도를 이해해서 수행
      • ⓑ 활용방법
        • 기본
          • GPT나 Gemini 같이 공개된 대형 언어 모델을 그냥 사용하는 방식으로 주로 실무자 개인 단위에서 데이터 분석, 문서 작성, 요약 같은 작업에 활용
        • 확장 : MCP(Context Protocol)
          • 클로드를 개발한 ai 연구회사인 앤스로픽에서 개발한 프로토콜로 생성형 AI가 외부 자원을 보다 쉽고 빠르게 활용할 수 있도록 만든 하나의 체계
            • 프로토콜 : 컴퓨터와 장치간의 데이터 송수신을 위한 일련의 법칙
          • 경쟁사인 MS, 오픈AI에서도 표준 프로토콜로 채택
          • MCP의 등장 이전에는 비표준화로 인해서 개발자가 생성형 AI와 외부 데이터, 자원 등을 활용할 때 별도의 API를 구축해서 진행해야 했었음.
            • 하지만, MCP의 등장으로 표준화되면서 보다 쉽게 개발을 할 수 있게됨
      • ⓒ 종류
        • 범용 모델 (파운데이션 모델)

          • 광범위한 사용 사례에 적용할 수 있도록 광범위한 데이터에 대해 훈련된 기계 학습 또는 딥 러닝 모델
            • 다양한 분야의 서비스에 적용할 수 있도록 개발되고 학습된 다목적 모델
            • LLM을 기반으로 만들어진 AI 챗봇, 리뷰 분석, AI 검색 같은 서비스를 SaaS 형태로 제공받아 쓰는 방식
            • 주로 기업 단위에서 고객 지원, 마케팅, 콘텐츠 제작처럼 정해진 업무의 효율성을 높이기 위해 사용
            • 장점 : 별도 개발 없이 바로 도입 가능하고, 초기 비용과 유지 부담이 적음
            • 한계 : 여러 기업을 대상으로 설계돼 개별 회사 데이터나 업종별 맥락을 깊게 반영하기 어려움
            •  

          특화 모델 (엣지 모델)

          • LLM을 활용해 기업의 내부 데이터와 업무 흐름을 반영한 전용 AI 시스템을 구축하는 방식
            • 장점 : 기업의 데이터를 최적화하여 활용할 수 있으며, 업종별 특성을 반영한 맞춤형 분석이 가능
            • 한계 : 초기 개발 비용과 도입 시간이 상대적으로 높습니다. 지속적인 유지보수 및 데이터 학습이 필요
        • -1 Chat PGT
          • GPT-4의 총 매개변수 1조7600개 (1760B)
        • -2 Gemini
          • 구글 개발 / 멀티모달 중 이미지 처리 성능이 뛰어남
        • -3 Claude
          • OpenAI 출신 연구자들이 만든  Anthropic에서 개발한 Claude는 코딩에 특화된 모델
          • 코드 작성, 디버깅, 기술 문서 정리 같은 작업에서 뛰어난 성능
        • -4 LLaMA
          • Meta 개발
          • 오픈소스만 제공
            • 오픈소스 특성으로 커스터마이징이 가능하여 자신만의 AI 만들 때 주로 사용
            • 일반 유저 접근 어려움
          • 버전
            • `25.4.6. 라마4(Llama 4)
              • 특징
                • MoE(전문가 혼합) 방식 도입하여 하나의 토큰을 처리할 때, 전체 파라미터 중 일부만 사용하는 등 필요한 AI만 활용하는 방식을 통해, 비용을 줄이고 성능을 높일 수 있음 (딥시크가 적극 사용하는 방식)
                  • 딥시크가 갖추지 못한 멀티모달 기능에 집중
                    • 텍스트와 이미지를 함께 처리할 수 있도록 초기 단계에서 정보를 결합하는 ‘초기 융합(early fusion)’ 기술을 적용해 멀티모달 기능을 기본으로 지원 
                    • "음성 등 많은 양의 정보를 한 번에 입력할 수 있는 최초의 개방형 멀티모달 모델" - 메타 관계자
                • 모델구성
                  모델명 총 매개변수 특징
                  스카우트 1,090억개(109B) 소형 모델 추론 처리 최적화
                  매버릭 4,000억개(400B) GPT-4o, 제미나이 2.0플래시 대비 우수 성능
                  코딩 및 사고력 부문에서 딥시크v3와 유사 성능
                  베헤모스 2조개(2T)  
        • -5 DeepSeek
          • 저비용 고성능 / 중국 데이터 유출 우려
        • -6 Grok
          • xAI에서 출시 / 규제없는 대화를 지향 / X(구 트위터) 로그인하여 무료 사용 가능
          • X 데이터를 실시간으로 끌어와 최신 정보를 반영 응답
            • 소셜 미디어 트렌드 분석, 최신 뉴스 답변
        • - 7 LG 엑사원
          • LG AI연구원은 이번 '엑사원 3.5'에서 온디바이스용 초경량 모델, 범용 목적의 경량 모델, 특화 분햐 고성능 모델 등 3종을 모두 오픈소스로 공개
            • LG는 `21.12월 출시한 ’엑사원‘ 모델을 최신화한 엑사원 3.5를 `24.12월에 출시하여 3가지 모델*을 공개
            • 스탠퍼드대 인간중심AI연구소의 AI 인덱스 보고서 2025에 유일 포함
      • ③ 멀티모달
        • 다양한 유형의 정보를 동시에 처리하고 활용하는 기술을 말합니다. 텍스트, 이미지, 음성, 비디오 등의 정보를 통합하여 학습하고 사고하는 인공지능(AI)
      • ④ AI 에이전트
        • 정의
          • 생성형 AI의 진화의 최신 단계로, 인간의 행동을 모방하고 자율적으로 작업을 수행할 수 있는 기술 (`24.12.09. CIO)
          • LLM과 전통적인 소프트웨어 애플리케이션이 결합돼 자율적으로 작업을 수행하는 시스템
          • 에이전틱 AI는 스스로 가설을 세우고 이를 검증하기 위한 추론을 진행하는 과정을 통해 자율적으로 의사결정을 할 수 있는 능동적인 AI를 말하며, 이를 구현하기 위해서는 기존 ‘지식 AI’를 넘어서는 ‘추론 AI’ 개발이 필수적
        • 특징
          • 핵심은 ‘에이전시(agency)’, 즉 소프트웨어가 독립적으로 행동할 수 있는 능력이다. 
        • 기존 생성형 AI 도구가 텍스트, 이미지, 음악 등 콘텐츠 생성에 초점을 맞췄다면, 
          • AI 에이전트는 문제 해결과 복잡한 작업 실행에 더 중점
        • AI 에이전트는 개방형 웹, 모바일 앱, OS에서 자율적으로 작업을 수행할 수 있는 특화된 에이전트를 제공
        • 회사별 모델 
          • `25.3.18. 로봇신문 / LG 엑사원 딥 -32B / EXAONE Deep-32B(출처)
            • 추론 AI 모델
            • 복잡한 수학 문제와 과학 문제 해결 능력에서 우수성을 입증
            • ‘엑사원 딥-32B’는 한국어에 강점이 있는 엑사원 파운데이션 모델을 기반으로 하고 있어 2025학년도 수능 수학 영역에서 94.5점으로 최고점을 기록. 선택과목(확률과 통계, 미적분, 기하) 모두에서 1등급을 달성했다. 또한, 수학 문제 해결 능력을 평가하는 지표인 수학(MATH)-500은 95.7점을 기록
              • 수학과 과학, 코딩 등 전문 분야 평가 지표에서 높은 성능을 보여줌으로써 향후 기업이 필요로 하는 전문 분야뿐만 아니라 물리와 화학 등 과학 연구와 교육 현장에서 활용도가 높아질 것으로 기대
            • 과학 문제 해결 능력을 평가하는 GPQA 다이아몬드 테스트에서 66.1점을 받아 매개변수 규모가 유사한 추론 AI 모델과의 경쟁에서 앞서는 결과를 기록했으며, 코딩 능력을 평가하는 라이브코드벤치(LiveCodeBench)도 59.5점을 기록하며 경쟁력 있는 성능을 보임
            • 미국의 비영리 AI 연구기관인 에포크(Epoch) AI가 선정하는 주목할 만한 AI 모델(Notable AI Models) 리스트에 등재되며 기술 경쟁력을 인정
      • ⑤ 피지컬 AI
        • 정의 : 현실 세계를 인식하고 판단해 실제 행동으로 옮기는 기술로 휴머노이드나 자율주행차 같은 물리적 기기에 탑재되는 AI
        • 특징 : 
        • 종류 : 
    • 다리오 아모데이
      • 다리오 아모데이 (1983년생)는 이탈리아계 미국인 인공지능 연구자이자 기업가입니다. 그는 대규모 언어 모델 시리즈인 클로드 AI(Claude AI)를 개발한 회사 인 앤트로픽(Anthropic) 의 공동 창립자이자 CEO입니다. 이전에는 오픈AI(OpenAI) 의 연구 담당 부사장을 역임
    • 앤드류 응 (Andrew yan-Tak Ng)
      • 미국의 컴퓨터 과학자.
      • 21세기, 딥러닝계에서 가장 괄목할 만한 성과를 올린 과학자 중 하나
      • 구글 AI 연구조직인 구글 브레인 창립멤버로 초거대 AI의 가능성을 제시한 인물
      • 인공지능은 편향성 공정성 정확성 등에서 문제가 있으나 기술의 발전으로 이러한 문제는 해결되고 있으며 전 세계 개발자들이 주의를 기울이고 노력해야 하는 부분 (`23.7.20., 서울대 특별강연 중)
      • 에이전틱 워크플로우
        • 정의
          • 여러 AI가 유기적으로 협력하여 복잡한 업무를 수행하는 방식
          • 개별 AI가 독립적으로 동작하는 것이 아닌 구조화된 프로세스 내에서 단계적 실행을 통해 결과 도출하는 것이 핵심
        • 기대효과
          • gpt-3.5 터보로도 gpt-4 수준의 결과물을 얻을 수 있음
          • 여러 회사의 모델을 한꺼번에 쓸 수 있음
    • 아틀라스
      • 현대자동차가 인수한 보스턴 다이내믹스에서 개발한 인간형(휴머노이드) 로봇
    • 스케일링 법칙
      • 스케일링 법칙(Scaling Laws)은 크기가 커질수록 효율성이 향상되는 현상
    • 샤오미의 완전 자율 '다크' 스마트 팩토리 (다크팩토리)
      • 인공지능(AI), 사물인터넷(IoT), 빅데이터 분석과 같은 첨단 기술을 통합하여 완전 자동화
      • 다크팩토리 : 사람의 개입 없이 운영되는 완전 자동화된 제조 시설
      • 연중무휴 24시간 가동
      • 최첨단 로봇, AI 및 IoT 기술을 활용하여 원활하고 매우 효율적인 생산 환경을 조성
      • 샤오미 차세대 스마트 팩토리의 주요 특징
        • 첫째, 완전 자동화된 운영. 샤오미의 새로운 공장의 핵심은 사람의 개입 없이 운영
          • 로봇과 자동화 시스템이 원자재 취급부터 최종 조립 및 품질 검사에 이르기까지 생산 공정의 모든 측면을 관리
          • 이러한 수준의 자동화는 효율성을 높일 뿐만 아니라 인적 오류의 위험을 최소화하여 일관된 제품 품질을 보장한다.
        • 둘째, 고급 기계 협업. 공장의 기계에는 고급 AI 및 IoT 기능이 탑재되어 있어 원활하게 소통하고 협업할 수 있다. 
          • 이러한 상호 연결성을 통해 실시간 데이터 공유 및 의사 결정이 가능하여 생산 프로세스를 최적화하고 다운타임을 줄일 수 있다.
        • 셋째, 지능형 품질 관리. 샤오미 스마트 팩토리의 품질 관리는 자체 개발한 지능형 기계로 관리된다. 
          • 이러한 시스템은 AI와 머신러닝을 사용하여 생산 품질을 실시간으로 모니터링하고 문제를 즉시 식별하고 해결한다. 
          • 이러한 접근 방식은 각 제품이 샤오미의 높은 품질 기준을 충족하도록 보장한다.
        • 넷째, 미크론 수준의 먼지 제거. 전자 제품 제조에서 먼지 없는 환경을 유지하는 것은 결함을 방지하고 제품의 신뢰성을 보장하기 위해 매우 중요하다. 
          • 샤오미의 공장에서는 자율적인 미크론 수준의 먼지 제거 시스템을 갖추고 있어 수동 개입 없이도 깨끗한 생산 환경을 조성한다.
        • 다섯째, 빠른 생산 속도. 샤오미의 새 공장의 가장 두드러진 특징 중 하나는 놀라운 생산 속도다. 
          • 이 공장은 1초에 한 대의 스마트폰을 생산할 수 있으며, 
          • 이는 자동화 시스템의 효율성과 정밀성을 입증하는 증거다.
        • 여섯째, 지속 가능성과 효율성: 이 공장의 설계는 지속 가능성과 에너지 효율성을 강조한다. 
          • 자동화 시스템은 에너지 사용을 최적화하고, 
          • 시설의 운영 효율성은 폐기물을 줄이고 생산 공정의 전반적인 환경 영향을 낮춘다.
    • 오픈AI 보안 우려
      • `24.5. 보안팀 해체 및 퇴사
        • 오픈AI는 지난 `24년 5월 AI 장기리스크 대비한 안전팀인 슈퍼얼라이언트 팀의 리더인 일리야 수츠케버의 퇴사와 함께, 해당 팀은 해체
      • `24.10. 보안팀 해체 및 퇴사
        • `24년 10월에는 오픈AI의 AI 기술 발전 능력과 이를 관리할 준비 상황 등을 자문하는 역할을 담당하는 AGI Readiness 팀 해체 및 해당 팀 책임자 마일스 브런데이지 또한 퇴사

 

반응형