<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Multimodal on 내가 먼저 엿보고 온 시간들</title><link>https://7hehans.github.io/tags/multimodal/</link><description>Recent content in Multimodal on 내가 먼저 엿보고 온 시간들</description><generator>Hugo -- 0.146.0</generator><language>ko-kr</language><lastBuildDate>Thu, 11 Sep 2025 00:00:00 +0000</lastBuildDate><atom:link href="https://7hehans.github.io/tags/multimodal/index.xml" rel="self" type="application/rss+xml"/><item><title>지능의 진화: AGI가 그리는 미래</title><link>https://7hehans.github.io/tech/agi/expected-agi/</link><pubDate>Thu, 11 Sep 2025 00:00:00 +0000</pubDate><guid>https://7hehans.github.io/tech/agi/expected-agi/</guid><description>&lt;h2 id="단일-task-중심에서-범용성으로-맥락을-이해하는-ai">단일 Task 중심에서 범용성으로: 맥락을 이해하는 AI&lt;/h2>
&lt;p>현재의 AI는 좁은 AI(Narrow AI), 즉 특정 작업을 수행하는 데 특화된 모델입니다.
예를 들어, 텍스트 생성 AI는 언어적 패턴을 학습하여 인간처럼 글을 쓰지만, 그 글의 의미나 함의를 깊이 이해하지는 못합니다.
이미지 인식 AI는 고양이와 개를 구분할 수 있지만, 그 사진이 왜 찍혔는지, 그 상황이 어떤 맥락인지 파악하지는 못합니다.&lt;/p>
&lt;p>&lt;strong>AGI(범용 인공지능)&lt;/strong> 로의 진화는 단순히 여러 개의 좁은 AI를 합치는 것이 아닙니다. 핵심은 &lt;strong>&amp;lsquo;맥락 이해(Contextual Understanding)&amp;rsquo;&lt;/strong> 와 &amp;lsquo;추론(Reasoning)&amp;rsquo; 능력의 획득입니다.
최근 주목받는 &lt;strong>&amp;lsquo;멀티모달(Multimodal) AI&amp;rsquo;&lt;/strong> 가 바로 이 방향의 첫걸음입니다. 텍스트, 이미지, 음성 등 여러 형태의 데이터를 동시에 처리하며 종합적인 판단을 내리는 기술이죠.
예를 들어, &amp;ldquo;이 사진을 보고 재미있는 이야기를 만들어줘&amp;quot;라는 명령에 대해 사진의 시각적 요소뿐만 아니라, 그 사진이 담고 있는 분위기와 의미까지 종합적으로 추론하여 창의적인 결과물을 내놓을 수 있게 됩니다.
이는 AGI가 다양한 상황에 적응하며 스스로 문제를 해결하는 능력을 갖추게 됨을 의미합니다.&lt;/p></description></item></channel></rss>