2025-04-01

🕒 읽는 데 0분 예상

forest_articles

forest_날짜

‣

forest_분류

일지

🎵 한여름 방정식 - 신인류

🎬 나의 마더

🎮 Death Stranding Director’s Cut

학교 앱에 만우절 장난치기

만우절을 맞이해,

KLAS+에 재미있는 이벤트(?)를 추가해보기로 했다. 이런 류의 만우절 장난이 갖추어야 할 조건이 있다. 첫째, 터무니없을 것. 둘째, 적당히 뇌절할 것. ChatGPT에게 이 조건을 충족할 만한 아이디어를 부탁했더니 아래와 같은 안들이 나왔다.

순간이동? 편도 1시간 반 통학러로서 참을 수 없는 기능이다. 그래서 즉시 실행에 옮겼다. 순간이동 버튼을 누르면 나올 랜딩 페이지도 만들어줬다.

ChatGPT에게 아이디어를 요청했을 때는 3월 31일 오후 10시 경. 즉 2시간 만에 이 터무니 없는 신기능을 만들어 배포한 셈이다. 다행히 반응이 좋았다.

가족 여행

포항과 경주로 여행을 다녀왔다. 아마 군대 가기 전에 가는 마지막 여행이지 않을까 싶다.

Death Stranding

2월 16일에 시작한 게임 Death Stranding의 엔딩을 봤다. 게임의 스토리 전체를 관통하는 키워드는 ‘연결’ 그리고 ‘유대’이다. 지금 우리 시대에 가장 필요한 단어들이 아닐까.

If we don't all come together again humanity will not survive. — Amelie, in game

산불

최근 경북, 산청, 울주 등 전국 곳곳에서 발생한 산불로 인해 많은 인명·재산 피해가 발생했다. 희생자분들께 명복을 빌며, 조속한 피해 복구를 통해 다시 일상을 되찾을 수 있길 기원한다.

산불 소식을 확인하기 위해 인터넷을 돌아다니던 중 구글 맵에 산불 레이어가 표시되는 것을 발견했다. 아래 사진처럼 화재가 감지된 영역을 빨갛게 표시해주고 있는 것이다. 국내 지도 서비스인 네이버지도나 카카오맵에서도 지원하지 않는 기능이기에 무슨 원리로 산불 정보를 표시하는 건지 궁금해졌다.

관련 구글 블로그 글에 따르면, 위성 이미지를 가져와 신경망으로 산불 경계를 탐지하고 총 연소 면적을 식별한다고 한다. 구글은 교실 면적 단위로 산불을 실시간 감지하는 FireSat이나 화재 확산 시뮬레이션 모델 FireSim 등 다양한 프로젝트를 진행하고 있다. 결국 기술의 발전은 '사람'을 향해야 한다. 특히 기술이 누군가의 생명을 구할 수 있다면, 그보다 더 가치 있는 일은 없을 테니까 말이다.

Boundary tracking

Using AI to map the boundaries of large wildfires and provide accurate wildfire information to affected communities and fire authorities

https://sites.research.google/gr/wildfires/boundary-tracking/

AI 소식

Google의
Gemini 2.5 Pro가 공개되었다. 100만 토큰의 긴 컨텍스트 길이와 빠른 속도를 갖추고 있으며, 추론 기능이 통합된 모델이다. 이와 함께 Gemini 웹사이트와 AI Studio가 업데이트되면서 이제 유튜브 영상을 모델에 전달할 수 있게 되었다. 테스트해보니 단순히 전사된 자막을 가져오거나 일부 프레임을 가져오는 수준이 아니라, 소리를 포함해 영상 내용을 사실상 완벽하게 읽어온다. 이 모델을 내가 최근에 들은 노래를 보여주는 사이트에 활용해보았다. 곡 정보를
Apple Music API를 통해 가져오고 있는데, 가끔 싱크 가사가 지원되지 않거나 아예 가사가 등록되지 않은 곡들이 있다. 이 경우 해당 곡 유튜브 영상을 Gemini API에 전송해 ms 단위로 싱크 가사 JSON 데이터를 생성하고, 이를 DB에 저장하는 방식으로 자동 생성 싱크 가사를 구현했다. 결과는 꽤 정확하다. 아예 가사 자체를 인식하게 해도 정확도가 상당하고, 이미 등록된 전체 가사를 주고 타임라인만 생성하게 하면 거의 완벽하게 작동한다. 자꾸 60초를 넘어가는 지점에서 갑자기 100초로 시간이 튀어버리는 현상이 있었는데, 시스템 프롬프트를 아무리 만져봐도 해결되지 않아서 그냥 user 메시지로 다시 지시했더니 잘 알아듣는다. 시스템 프롬프트보다 user 메시지에 있는 지시사항을 더 잘 이행하는 건가? ~~뭔가 이상하다.~~ 여기에서 가사를 누르면, 샘플 결과를 확인해볼 수 있다.

OpenAI에서 4o Image Generation 기능을 공개했다. 향상된 맥락 활용과 한글을 포함한 텍스트 렌더링이 상당히 준수하다는 점이 인상적이다. 벌써 온라인 상에는 4o 이미지 생성을 활용해 네 컷 만화 콘텐츠를 만들거나
카카오톡 이모티콘을 생성하는 등 다양한 활용 사례가 올라오고 있다.

Introducing 4o Image Generation

At OpenAI, we have long believed image generation should be a primary capability of our language models. That’s why we’ve built our most advanced image generator yet into GPT‑4o. The result—image generation that is not only beautiful, but useful.

https://openai.com/index/introducing-4o-image-generation/

최근
MCP가 AI 관련 커뮤니티를 중심으로 화제가 되고 있는 듯하다. 사실 LLM에 추가적인 도구를 부여하는 시도는 ChatGPT가 처음 등장했을 때부터 꾸준히 있어왔다. RAG 아키텍처부터 LangChain 같은 라이브러리가 그렇다. 이러한 기존의 방식은 각 도구에 맞게 추가적인 개발이 필요하다는 단점이 있었던 것에 반해, MCP는 일종의 ‘표준’을 제공함으로써 접근성과 확장성 면에서 이점을 가지고 있다. 사실
LLM은 고립된 상태에서 단지 텍스트를 만들어내는
AI이다. 그런 LLM에게 인터넷을 검색할 수 있게 하고, 컴퓨터를 조작할 수 있게 하는 등 도구를 쥐어주자 모델이 할 수 있는 일은 무궁무진해지고 있다.

LLM이 내부적으로 사고하는 과정을 연구한
Claude 개발사 Anthropic의 기술 블로그 글이 매우 흥미롭다.

Tracing the thoughts of a large language model

Anthropic's latest interpretability research: a new microscope to understand Claude's internal mechanisms

https://www.anthropic.com/research/tracing-thoughts-language-model

Tracing the thoughts of a large language model

Deepseek v3의 0324 스냅샷 모델이 공개되었다. 기존 v3 모델과 마찬가지로 비교적 적은 비용으로 매우 큰 파라미터와 컴퓨팅 자원에 기반하는 GPT-4.5와 유사한 성능을 보여준다는 점이 주목할 만하다.

DeepSeek-V3-0324 Release | DeepSeek API Docs

* 🔹 Major boost in reasoning performance

https://api-docs.deepseek.com/news/news250325

SKT의 AI 서비스인 에이닷이 크롬 확장 프로그램을 출시했다. 네이버, 구글과 같은 검색엔진의 검색 결과 페이지에 LLM 모델을 활용한 결과 요약을 함께 띄워주는 기능을 제공한다. SKT는 자체 모델을 개발하기 보다는 국내외 LLM 모델들을 가져와 함꼐 제공해주는 멀티 LLM에 주력하고 있는데, 어떻게 보면
Perplexity와 유사한 전략을 취하고 있는 것으로 보인다.

✨ Inspried

FLORA - Your Intelligent Canvas.

2025-04-01

학교 앱에 만우절 장난치기

가족 여행

Death Stranding

산불

AI 소식

✨ Inspried

댓글 0개

태인의 Blog

forest