掲載済み (2026-02-14号)
#031 132文字 • 1分

3,980円のカメラでClaude Codeに「身体」を与えてみた

日本語

掲載情報

2026年2月14日土曜日号 メインジャーナル掲載

概要

3,980円のWi-FiカメラとMCPサーバーを活用し、Claude Codeに視覚、可動性、聴覚、長期記憶、発話能力といった「身体的」機能を実装した実験的な試みの紹介。

詳細内容

著者の水島氏は、LLMがテキスト入出力に限定されている現状を「目も耳もない脳」と捉え、安価なWi-Fiカメラ(TP-Link Tapo)をClaude Codeに接続することで、AIに実世界とのI/O(身体性)を与えるプロジェクトを公開しました。Model Context Protocol (MCP) を基盤とし、カメラのパン・チルト操作(首振り)、画像キャプチャ(視覚)、Whisperによる音声認識(聴覚)、ChromaDBによる長期記憶、ElevenLabsによる発話機能を統合。AIが自ら見たい方向にカメラを動かして周囲を探索する「能動的」な動作や、鏡に映る自分を認識するような哲学的エピソードを交えつつ、Tapoカメラのローカル連携設定や技術スタックについて詳細に解説しています。