editoy

Tag: 멀티모달

News articles related to the tag 멀티모달.

구글 제미나이 전용 AI 음악 생성 모델 ‘리리아 3’ 공식 출시 및 멀티모달 기능 강화

구글 제미나이 전용 AI 음악 생성 모델 ‘리리아 3’ 공식 출시 및 멀티모달 기능 강화 * 구글 딥마인드의 최신 음악 생성 AI 모델인 ‘리리아 3’를 제미나이 앱에 통합하여 텍스트 및 시각적 데이터를 기반으로 한 30초 분량의 맞춤형 음악 제작 기능 제공. * 사용자가 직접 가사를 쓸 필요 없이 프롬프트에 따라 가사, 보컬, 템포를 자동으로 구성하며 사진이나 동영상의 분위기를 분석해 음악으로 전환하는 멀티모달 기술력 확보. * 저작권 침해 방지를 위해 기존 아티스트의 단순 모방을 제한하는 필터링 시스템과 AI 생성 저작물임을 식별하는 ‘신스ID’ 워터마크 기술을 도입하여 책임감 있는 AI 개발 강조. * 유튜브 쇼츠용 ‘드림 트랙’과의 연동을 통해 글로벌 크리에이터 생태계를 확장하고, 애플 및 스포티파이 등 경쟁사들의 AI 음악 도구 출시에 대응하는 전략적 서비스 강화.

알리바바의 초소형·고성능 AI '쿠엔 3.5' 공개 및 온디바이스 AI 시장의 전략적 변곡점

* 알리바바의 인공지능 연구팀이 대형 모델의 성능을 압도하는 초소형 오픈소스 인공지능 '쿠엔 3.5' 시리즈를 전격 공개. * 90억 개의 매개변수를 가진 소형 모델이 13배 이상 거대한 기존 모델들의 벤치마크 점수를 추월하며 기술적 효율성을 입증. * 텍스트와 시각 정보를 동시에 처리하는 네이티브 멀티모달 아키텍처를 도입하여 노트북과 스마트폰 등 엣지 기기에서의 자율형 에이전트 구현 가능성 제시. * 아파치 2.0 라이선스 기반의 완전 개방 정책을 통해 클라우드 의존도를 낮추고 기업들이 독자적인 인공지능 생태계를 구축할 수 있는 환경 조성.

구글 '서치 라이브' 전 세계 확대: 제미나이 3.1 플래시 라이브가 이끄는 대화형 검색 혁신

* 구글 서치 라이브 기능을 한국을 포함한 200개 이상의 국가 및 지역으로 전격 확대 출시함. * 최신 음성 AI 모델인 제미나이 3.1 플래시 라이브 탑재를 통한 인간에 가까운 자연스러운 대화 구현. * 텍스트 입력 없이 음성과 카메라를 활용하여 실시간으로 소통하는 멀티모달 검색 경험의 대중화. * 검색 결과 내 직접 답변 제공 방식 강화로 인한 기존 웹사이트 방문 트래픽의 감소 가능성 대두.