2025-01-25

🕒 읽는 데 0분 예상
forest_articles
forest_날짜
forest_분류
일지
🎬 파일럿, 와일드 로봇
📕 위시 (니컬러스 스파크스)

AI 에이전트 전쟁의 시작?

2024-11-10
에 2025년은
AI
에이전트의 해가 될 것이라고 예상했던 바가 있다. 이를 방증하듯, 이번 주에는 AI 에이전트 관련 소식이 쏟아져나왔다.
  • 23일 새벽 3시에 삼성전자의 새로운 플래그십
    스마트폰
    ,
    갤럭시
    S25 시리즈가 공개되었다. 언팩 행사의 내용은 절반 이상이 AI로 채워졌다.
    Google
    Gemini
    와의 연동을 통해 삼성 기본 앱과 구글 검색 기능을 오가며 스마트폰을 제어하는 기능이 주요 마케팅 포인트로 보인다.
    Apple
    iOS
    에 Apple Intelligence 도입을 미루고 있는 상황에서 사실상 스마트폰에 통합된 AI 기능 중 가장 ‘에이전트’에 가까워보인다.
  • Perplexity
    안드로이드 앱에 Assistant 기능이 추가되었다. S25를 시작으로 탑재될 Gemini와 유사한 수준의 앱 연동 기능을 제공한다. 시스템 설정에서 Digital Assistant 앱으로 지정하여 제스처를 통해 빠른 실행도 가능하다.
  • 위의 2가지는 외부 API 연동을 통해 구현한 ‘준’에이전트였다면,
    OpenAI
    에서 공개한 Operator는 보다 완전한 의미의 에이전트이다. 사용자의 요구사항으로 부터 실제 가상 컴퓨터를 조작하며 동작을 실행한다. 예를 들어, 특정 쇼핑몰에서 물을 주문해달라고 요구하면 AI가 스스로
    브라우저
    로 쇼핑몰을 열어 상품을 검색하고, 구매하기 버튼을 눌러 구매를 진행하는 식이다. 시연 영상은 아래 링크에서 볼 수 있다. 월 200달러인 Pro 플랜에서만 쓸 수 있어서 직접 써보진 못했지만, 시연 영상들을 보니 로그인이나 CAPTCHAs 해제와 같은 작업들은 수행하지 못해서 아직까진 사람이 직접 하는게 더 편해보인다. 다만 컴퓨터 사용 능력을 측정하는 벤치마크인 OSWorld를 살펴보면, 기존에 공개됐던
    Claude
    Computer Use가 22%인데 비해 38.1%로 상당한 발전을 보여주었다. 참고로 사람은 72.4%라고 한다. 앞으로 AI 에이전트가 얼마나 발전하여 우리 일상을 어떻게 바꿀지 궁금하다.
  • browserbase/open-operator: AI를 위한 웹 브라우징 기술을 개발하는 browserbase에서 무료로 사용가능한 Open Operator를 공개했다. 물론 OpenAI의 Operator에 비하면 속도나 성능 면에서 떨어지는 프로토타입이긴 하지만, 웹 브라우저를 사용할 수 있는 AI 에이전트가 무료로 공개됐다는 점이 괄목할 만하다.

Deepseek R1

중국
의 AI 기업인
Deepseek
가 o1에 견줄만한 추론 모델, Deepseek-R1을 공개했다. 자체 공개한 벤치마크 점수를 보면 OpenAI의 o1과 유사하거나 앞선다. 주목할 만한 점은 비용이다. chat.deepseek.com에 접속하면 R1 모델을 무료로 제한 없이 사용할 수 있고, API 비용 역시 OpenAI의 경량 추론 모델인 o1-mini와 비교하더라도 6배 이상 저렴하다. 성능이 유사한 o1과 비교하면 무려 30배 가량 저렴하다.
더 놀라운 것은 R1 모델과 증류 모델들을 모두 오픈소스로 공개했다는 점이다. 앞으로 추론 모델이 특정 기업의 전유물을 벗어나 보다 많은 곳에 적용될 가능성이 열렸다.
중국 기업이라는 점에서 기인한 한계도 존재한다. 시진핑에 대해 질문하자 답변을 거부한다.
notion image

“Fly like you, not like them”

살아남기 위해서는, 때로 프로그래밍된 본성을 뛰어넘어야 해.
드림웍스의 애니메이션 ‘와일드 로봇’을 봤다. 로봇 ‘로즈’가 야생에서 동물들과 교감하며 감정을 배워가는 모습은 현대 사회의 기계와 인간의 공존, 그리고 기술과 자연의 공존에 대해 생각해보게 한다. 작품 속 동물들은 서로 먹고 먹히는 먹이 사슬로 얽혀있지만, 위기 상황에서 서로 다른 존재를 받아들이며 공동의 목표를 위해 힘을 합친다. 감정을 느끼고 생각을 하는 ‘생명체’이기에 가능한 협력통합의 정신, 지금 우리 사회에 가장 필요한 것이 아닐까.
출처: Dreamworks
출처: Dreamworks

갈수록 진화하는 해킹 기술

얼마 전, 구글에
카카오
톡 pc 버전 설치를 검색했다가 놀란 적이 있다. 최상단에 위치한 링크가 공식 홈페이지가 아닌 피싱 페이지였던 것이다. 아무 생각없이 제일 위에 표시된 링크를 클릭해 프로그램을 설치하면 해킹 위협에 고스란히 노출되는 것이다. 이를
SEO Poisoning
이라 한다.
그런가 하면, 더블 클릭을 유도한 후 해당 클릭 위치에 외부 계정 연동 동의 버튼과 같이 타겟 동작이 위치한 팝업창을 띄워 사용자가 의도하지 않은 클릭을 하게 하는 DoubleClick Jacking 기법도 존재한다. 매우 참신한 아이디어라 공유해본다.

Korea Design System, KRDS

대한민국
정부 디자인 시스템 KRDS가 공개되었다. 기존에도 디지털 정부서비스 UI/UX 가이드라인이라는 이름으로 가이드 문서가 존재했으나, 이번에 KRDS라는 이름으로 개편되면서 디자인 시스템으로 확장된 것이다. Figma 디자인 리소스나 HTML Component Kit도 제공하고 있다.
ctdesign/gov-design-systems-list에서 세계 각 국 정부기관의 디자인 시스템을 구경해볼 수 있다. 하나씩 살펴본 결과, 한국이 이번에 만든 KRDS가 상당히 현대적이고, 민간 기업에서 사용할 법한 퀄리티의 잘 만들어진 디자인 시스템이라는 생각이 든다. 잘 만들어 놓기만 하고, 쓰지 않으면 의미가 없으니 많은 정부기관 서비스들에 적용되길 바란다.

✨ Inspried

 

댓글 0