인공지능(AI) 기술 경쟁이 더욱 치열해지고 있다. 최근 메타가 공개한 오픈소스 AI 모델 '라마 3.1'이 GPT-4와 클로드 3.5 등 최고 수준의 독점 모델들과 비슷한 성능을 보이면서 AI 업계에 큰 파장을 일으켰다.
라마 3.1은 8개 언어를 지원하며, 128K의 컨텍스트 길이를 가진 3개 모델로 구성되어 있다. 15조 개 이상의 토큰 데이터로 훈련되었으며, 16,000개 이상의 H100 GPU를 사용해 훈련되었다. 누구나 파인튜닝하고 배포할 수 있는 완전 오픈소스 모델이라는 점이 주목받고 있다.
특히 라마 3.1의 7B 모델은 GPT-3.5 Turbo를 훨씬 뛰어넘는 성능을 보여주고 있어, 업계에 충격을 주고 있다. 이는 오픈소스 모델이 독점 모델과의 격차를 빠르게 좁히고 있음을 보여주는 증거로 해석된다.
메타 CEO 마크 저커버그는 "오픈소스 AI가 미래의 길"이라고 강조하며, 개발자와 기업, 그리고 AI 세계 전반에 오픈소스가 가져올 이점을 설명했다. 이는 AI 기술의 민주화와 혁신 가속화를 위한 전략으로 해석된다.
저커버그는 특히 개인정보 보호 측면에서 오픈소스 AI의 장점을 강조했다. 기업들이 민감한 데이터를 외부 AI 서비스에 제공하지 않고도 자체적으로 AI를 운영할 수 있다는 점을 언급했다.
이에 대응해 오픈AI도 GPT-4 Turbo의 파인튜닝 기능을 공개했지만, 제한적인 형식과 검열 등의 한계로 인해 오픈소스 모델에 비해 불리한 상황이다. 오픈AI는 하루에 200만 토큰까지 무료로 훈련할 수 있도록 했지만, 이는 여전히 제한적이라는 평가를 받고 있다.
또한, 오픈AI의 안전 정책 자동화 전략과 안전 부서 축소 움직임은 우려를 낳고 있다. AI 안전성 평가를 AI 모델에 맡기는 전략은 효율성을 높일 수 있지만, 동시에 윤리적 문제를 야기할 수 있다는 지적이 나오고 있다.
한편, 구글은 수학 추론에 특화된 AI 모델을 개발해 수학 올림피아드 은메달 수준의 성과를 거두었으며, 이를 Gemini에 통합할 계획을 밝혔다. 이는 AGI(인공일반지능) 개발을 위한 중요한 진전으로 평가받고 있다.
구글의 새로운 AI 모델은 알파고의 학습 알고리즘과 결합하여 수학 문제를 해결하는 새로운 접근 방식을 채택했다. 이는 AI가 인간의 추상적 사고 능력에 한 걸음 더 가까워졌음을 의미한다.
일론 머스크의 xAI는 10만 개의 GPU 클러스터를 구축하며 "세계에서 가장 강력한 AI 트레이닝 클러스터"를 만들었다고 발표했다. 이는 라마 3.1 훈련에 사용된 GPU 수의 10배에 달하는 규모로, 업계의 이목을 집중시키고 있다.
머스크의 이러한 움직임은 AI 개발 경쟁에서 뒤처지지 않겠다는 의지를 보여주는 것으로 해석된다. xAI의 'Grok' 모델이 어떤 성능을 보여줄지 업계의 관심이 집중되고 있다.
AI 기술의 발전은 음악, 이미지, 비디오 생성 분야로도 확대되고 있다. Suno AI의 스템 분리 기술은 음악 산업에 혁명을 일으킬 잠재력을 보여주고 있다. 이 기술은 완성된 음악 트랙에서 보컬과 악기 소리를 분리할 수 있어, 음악 편집과 리믹스 작업을 획기적으로 간소화할 수 있다.
어도비의 일러스트레이터 AI 기능 업데이트는 디자인 작업의 효율성을 크게 높일 것으로 기대된다. 특히 벡터 이미지 생성과 패턴 디자인 기능은 디자이너들의 작업 시간을 대폭 줄여줄 것으로 예상된다.
스태빌리티 AI의 3D 비디오 생성 기술 'Stable Video 3D'는 단일 이미지에서 3D 비디오를 생성할 수 있는 혁신적인 기술이다. 이는 영화, 게임, VR 등 다양한 분야에서 활용될 수 있을 것으로 기대된다.
네이버 웹툰의 '캐릭터 챗' 서비스도 100만 명의 사용자를 확보하며 성공적으로 런칭했다. 이는 AI 기술이 엔터테인먼트 산업에 미치는 영향력을 보여주는 좋은 사례다.
이러한 급속한 발전 속에서 AI 안전성과 윤리적 문제, 그리고 AI 생성 데이터의 품질 문제 등에 대한 우려의 목소리도 제기되고 있다. 특히, AI로 생성된 데이터로 훈련된 모델의 장기적 품질 저하 가능성에 대한 연구 결과가 발표되어 주목받고 있다.
네이처에 발표된 논문에 따르면, AI 생성 데이터로 훈련된 모델은 시간이 지날수록 품질이 저하될 수 있다고 한다. 이는 AI 모델의 지속가능성에 대한 의문을 제기하고 있으며, 향후 AI 개발 방향에 큰 영향을 미칠 수 있는 중요한 발견이다.
또한, 런웨이(Runway)의 AI 모델 훈련 데이터에 유튜브 영상이 무단으로 사용되었다는 의혹이 제기되어 AI 학습 데이터의 저작권 문제가 다시 한번 부각되고 있다. 이는 AI 기술 발전과 저작권법 간의 충돌을 보여주는 사례로, 향후 AI 개발에 있어 중요한 법적, 윤리적 과제가 될 것으로 보인다.
AI 기술 경쟁이 가속화되면서 기업들의 투자도 급증하고 있지만, 동시에 AI 버블에 대한 우려의 목소리도 나오고 있다. 오픈AI의 경우 올해 7조 원의 적자가 예상되는 등 AI 기업들의 수익성 문제도 대두되고 있다.
세콰이어 캐피털 등 일부 투자 회사들은 AI 기업들의 높은 기업 가치에 대해 의문을 제기하고 있다. 실제 수익 창출이 미미한 상황에서 과도한 투자가 이루어지고 있다는 지적이다.
그러나 동시에 많은 전문가들은 AI 기술의 잠재력을 고려할 때 현재의 투자가 과도하지 않다고 주장한다. AI가 가져올 경제적, 사회적 변화의 규모를 고려하면 현재의 투자는 오히려 부족할 수 있다는 의견도 있다.
이러한 복잡한 상황 속에서 AI 업계는 기술 혁신을 지속하면서도 윤리적, 경제적 도전과제들을 해결해 나가야 하는 중요한 시기를 맞이하고 있다. 앞으로 AI 기술이 어떻게 발전하고 사회에 어떤 영향을 미칠지 전 세계의 관심이 집중되고 있다.
특히 오픈소스 모델의 부상은 AI 기술의 민주화를 가속화할 것으로 보인다. 이는 더 많은 개발자와 기업들이 AI 기술을 활용할 수 있게 되어, 혁신의 속도가 더욱 빨라질 수 있음을 의미한다. 동시에 AI 기술의 확산은 개인정보 보호, 데이터 편향성, 윤리적 사용 등의 문제에 대한 사회적 논의를 더욱 활발하게 만들 것으로 예상된다. 결론적으로, AI 기술은 이제 단순한 기술 혁신을 넘어 사회 전반에 걸친 변화를 이끌고 있다. 기업, 정부, 학계, 시민사회 등 다양한 주체들의 협력과 논의를 통해 AI 기술의 발전과 그에 따른 사회적 변화에 대비해야 할 때다.
HealthEco.Media 정진성 기자 |