본문 바로가기
카테고리 없음

‘앱에이전트’, 포스트 생성AI 기술로 주목

by 중소기업투데이 2024. 1. 17.

기기에 AI 내장, 사용자 명령 하나로 LLM이 직접 앱 가동

‘CES 2024’서 래빗의 AI네이티브 휴대용기기 ‘R1’ 등장

래빗사가 개발한 앱에이전트 기기인 R1.[테크레이다]

 

[중소기업투데이 조민혁 기자] 생성AI 시대 다음의 앱에이전트(AppAgent) 시대가 열릴 전망이다. 터치 스크린이나 키패드 입력 같이 사람이 작동하는 것처럼 LLM이 직접 앱을 구동할 수 있게 된다.

실제로 지난 ‘CES 2024’에 등장한 AI 네이티브 휴대용 기기 ‘R1’이 그런 경우다. 이는 처음으로 앱에이전트를 상용화한 제품이라 해도 과언이 아니다. 래빗(Rabbit)이 개발한 R1은 쉽게 말해 AI가 내장된 기기를 품에 넣고 다니며, 마치 스마트폰 터치하듯 AI를 실행하면 바로 각종 앱이 가동되는 것이다.

이에 “가까운 미래에 스마트폰에도 이 기술이 적용되면, 굳이 사용자가 앱을 터치할 필요없이 AI에 (음성, 텍스트 등 프롬프트로) 명령만 내리면 어떤 앱이든 구동할 수 있을 것”이란 예상까지 나온다.

AI 개발 스타트업인 래빗은 이 제품에 Rabbit OS라는 AI 전용 운영체제를 탑재하고 있다. 터치스크린이 되는 작은 화면과 마이크, 스피커가 내장돼 있다. 사용자가 버튼을 누르고 음성으로 명령만 내리면 4GB 램, 128GB 저장공간, 와이파이와 4G를 지원하고 통화도 가능하다.

수많은 앱, 버튼 하나로 통합 실행

이는 기존 스마트폰과도 전혀 다르다. 기존 스마트폰에서 앱을 구동하려면 수많은 앱들을 각각 실행해야 한다. AI개발자들은 평소 이런 불편을 지적해왔다. 기존 아이폰의 ‘시리’도 이를 통합할 수는 있지만, 룰베이스 AI의 이해력이 떨어져 한계가 있다는 지적이다.

LLM 기반의 챗GPT 플러그인이 나오면서 다소 상황이 나아졌지만 여전히 한계가 있다. 일단 이는 LLM의 프롬프트 이해력을 API 호출 기능과 연결, 특정 앱을 수행할 수 있게 되었다. 사용자가 말로 명령을 내리면, LLM이 그 API를 실행하기 위한 세부적인 방법을 제 나름대로 탐색한다.

그러나 챗GPT 플러그인은 플러그인 기능을 적용하려면 앱 하나하나마다 일일이 개발자가 LLM과 연동할 수 있는 자체 플러그인을 만들어야 했다.

이에 비해 앱에이전트 기반의 R1은 LLM이 직접 앱을 조작할 수 있다. 스마트폰 화면이나 키패드 입력처럼 앱에이전트가 스스로 사람의 명령을 입력, 직접 앱을 구동하는 것이다.

따지고보면 R1보다 앞서 중국의 텐센트가 이미 이같은 앱에이전트를 개발한 바 있다. 이는 생성AI의 다음 단계인 ‘AutoGPT’나 ‘Generative Agents’ 같은 자율적인 모델로 접어드는 조짐으로 해석됐다. 다만 본격적인 상용화는 아직 시도하지 않고 있다.

앱에이전트를 가장 먼저 상용화한 R1은 사용자의 명령과 화면의 스크린샷을 보고 자체 LLM 스스로 어떤 작업을 해야 하는지 결정한다. 사용자가 터치하기만 하면, 별도의 API 호출 없이 앱을 조작, 구동한다. 이런 기능은 다양한 앱에 모두 적용된다.

물론 GPT-4도 나름대로 오토GPT를 지향하는 기능을 갖고 있다. 그러나 전문적인 실험 결과 R1은 GPT-4보다 앱에이전트의 성능이 월등히 높은 것으로 나타났다.

이는 다만 기존 스마트폰처럼 R1에 외부 앱을 설치할 수는 없다. 이에 래빗사는 자체적인 ‘Rabbit Hole Web Portal’을 제공하고 있다. 사용자들은 포털 사이트에서 자신이 사용하고픈 각종 앱서비스를 지정할 수 있다. 이를 위해 사용자 계정으로 포털에 로그인을 해놓으면 R1으로 쉽게 조작할 수 있다.

R1은 또 가상머신 기술과 LAM(Large Action Model, 대형행동모델) 기술을 적용한 것으로 알려졌다. 사용자가 특정 서비스를 명령하면 래빗 클라우드에서 가상머신을 실행, 사용자계정으로 해당 앱의 로그인을 한다. 그런 다음 앱의 UI를 통해 직접 AI가 조작, 앱을 작동시킨다. 그 과정에서 특히 LAM을 새로 학습하도록 했다. 이는 LLM보다 더욱 진화된 것으로 텍스트와 함께 UI 액션까지 곁들인 것이다.

또 래빗사의 웹 포털에 없는 서비스를 사용하려면, ‘Teach 모드’로 직접 학습하도록 했다. 사이트 주소를 입력하고 녹화버튼을 누른 다음 원하는 기능을 사용자가 직접 실행하는 것이다. 일단 이런 방식으로 한번 등록해놓으며, 다음부턴 R1에게 명령만 하면 자동으로 해당 기능을 수행한다.

전문가들 “머지 않아 스마트폰에도 적용”

그러나 웹 포털로 앱서비스를 연결하는건 매우 불편하다는 지적도 따른다. 이는 래빗사 자체로선 앱 생태계를 구축하기 어렵기 때문에 나온 고육지책으로 해석된다. 그럼에도 불구하고, 이를 접한 AI개발자들은 “플러그인의 경우 각각의 앱이 자신의 API와 연동하는 플러그인을 개발해야 했지만, 래빗의 LAM을 쓰면 이런 문제가 해결된다. 거추장스러운 플러그인을 지원 안해도 모든 앱을 말로 조작할 수 있다”고 놀라워하기도 한다.

현재 R1의 가격은 200달러 미만이다. 기기만 구입하면 별도의 사용료도 없다. 이는 “초기 유저를 확보하기 위해 거의 무료로 보급하는 셈”이라는 해석이다.

문제는 앞으로 전개될 상황이다. 이번에 출현한 R1을 기존 스마트폰 제조업체들도 눈여겨보고 있다. 언젠가는 아이폰이나 안드로이드에 RI의 앱에이전트 기능이 내장될 수도 있기 때문이다. 결국 앱에이전트 기술의 완성도와 생태계 능력이 경쟁의 관건이 될 것이란 전망이다.

 

출처 : 중소기업투데이 http://www.sbiztoday.kr/