【Claude Code】Excel方眼紙の詳細設計書とどう向き合うか
【Claude Code】Excel方眼紙の詳細設計書とどう向き合うか
日本のIT現場に根付く「Excel方眼紙」の設計書を、AIコーディングエージェントClaude Codeに効率的に理解させるための5つの技術的アプローチと、実務での現実的な向き合い方を解説したガイド。
【Claude Code】Excel方眼紙の詳細設計書とどう向き合うか
日本のIT現場に根付く「Excel方眼紙」の設計書を、AIコーディングエージェントClaude Codeに効率的に理解させるための5つの技術的アプローチと、実務での現実的な向き合い方を解説したガイド。
The last interface. Will AI agents kill design as we know it?
AIエージェントが複雑なUIをバイパスし、ユーザーの意図に基づきインターフェースを動的に生成する未来において、デザイナーの役割は画面制作からアルゴリズムの制約設計へと進化する。
Liz Reid on the future of Google Search and AI
Google検索責任者のリズ・リード氏が、AIによる検索の進化は既存機能の置き換えではなく「拡張」であり、オープンウェブとの共生を重視し続ける戦略を語りました。
AI and the illegal war
AI技術が軍事転用され民間人犠牲を招く中で、ビッグテックとメディアが癒着し、経済的価値の低いAIを軍事プロパガンダで支える構造を批判する論評。
xAI loses bid to halt California AI data disclosure law
イーロン・マスク氏率いるxAI社が、AI学習データの開示を義務付けるカリフォルニア州法の執行停止を求めた申し立てが、裁判所によって却下されました。
Iran Strikes: Anthropic Claude AI Helped US Attack, But How Exactly?
2026年に発生したとされるイランによる攻撃への米国の対応において、AnthropicのAIモデル「Claude」が果たした具体的な役割と、AIの軍事利用に伴うガバナンスの欠如を指摘する論評。
How Palantir and Anthropic AI helped the US hit 1,000 Iran targets in 24 hours
米国防総省がPalantirのMavenシステムとAnthropicのClaude AIを連携させ、イランへの攻撃において24時間以内に1,000件の標的を選定・分析したことが報じられました。
Addicted to Claude Code–Help | Hacker News
AnthropicのCLIツール「Claude Code」に没頭するユーザーたちが、圧倒的な開発スピードによる中毒性と、それが真の生産性なのか、あるいは単なる「生産性の錯覚」なのかを巡り議論を展開している。
BREAKING: Sam Altman’s greed and dishonesty are finally catching up to him
AI研究者のゲイリー・マーカスが、サム・アルトマンの不誠実な性格と自己利益の追求がついに公の知るところとなり、OpenAIの崩壊とボイコットを招いていると主張している。
Why developers using AI are working longer hours
AIはソフトウェア開発の効率を上げた一方で、不具合修正の増加や企業からの過度な期待により、エンジニアの労働時間とバーンアウトのリスクを増大させている。
Will Claude Code ruin our team?
AIコーディングツールの進化により、エンジニア・PM・デザイナーの境界が曖昧になり、実装よりも「判断」が重要視される時代におけるチームビルディングの変遷を考察する。
llm9p: LLM exposed as a 9P filesystem
llm9pは、大規模言語モデルを9Pファイルシステムとしてマウントし、標準的なファイル操作を通じてAIとの対話を可能にする画期的なインターフェースです。
I'm not consulting an LLM
LLMによる即時の回答提供は、検索過程で得られる「知的摩擦」や「試行錯誤」という経験を奪い、結果として人間の知性を衰退させる恐れがある。
Phi-4-reasoning-vision and the lessons of training a multimodal reasoning model
Microsoft Researchが、150億パラメータで数学・科学推論やGUI操作に優れた軽量マルチモーダルモデル「Phi-4-reasoning-vision」を発表し、効率的な学習手法と推論/非推論の混合制御について公開しました。
Claude Struggles To Cope With ChatGPT Exodus
ChatGPTからAnthropicのClaudeへと乗り換えるユーザーが急増した結果、サーバーの負荷増大とサービスの安定性維持という新たな課題に直面している現状を分析しています。
Based on its own charter, OpenAI should surrender the race
OpenAIの憲章にある「他社がAGIに近ければ競争を停止し協力する」という条項に基づき、現在のベンチマークでの劣勢と短縮された予測を鑑みると、同社は理念通りに撤退すべきだとする論評。
Agent Safehouse
macOSのカーネルレベル保護機能を使用し、ローカルAIエージェントによるファイルの誤削除や重要データへのアクセスを防止するオープンソースのサンドボックス環境。
Anthropicが提供する「skill-creator」を活用し、Claude Code用スキルの作成から定量的評価、プロンプトの自動最適化までを行うHuman-in-the-loopな開発フローを解説しています。
AWS、AWS上ですぐ使えるOpenClawを提供開始。仮想プライベートサーバ(VPS)「Amazon Lightsail」のインスタンスイメージとして
AWSは、仮想プライベートサーバ「Amazon Lightsail」において、自律型AIエージェント「OpenClaw」を即座に導入できる事前設定済みイメージの提供を開始しました。
Claude Codeのスケジュールタスクで定期作業を自動化する方法 #AI - Qiita
Claude Codeに追加された`/loop`コマンドとDesktop版のスケジュール機能を活用し、監視やレビューなどの繰り返し作業を自動化する具体的な手法を解説しています。
Claude Codeを用い、人間が一行もコードを書かずにRust製の高速なjq互換JITコンパイラ「jq-jit」を自律的に開発させた驚異的な記録。
生成AIの利便性が技術者の試行錯誤を奪い、知識構造が育たない「空洞化した精神」を招くリスクと、それを防ぐための「認知的主権」の維持の重要性を説く。
VS Code v1.110の新機能により、チャットの会話内容からGitHub Copilotのプロンプト、スキル、エージェント、フックを対話形式で自動生成することが可能になりました。
Claude Max (20倍プラン) を1ヶ月以上契約して感じたこと
Claude Maxの高頻度プランを1ヶ月以上活用し、ゲーム開発やツール制作を通じて得られたAI駆動開発の実感と、言語選択や開発体験の変化を綴った実践レポート。
AIの圧倒的な生成量とレビュワー育成の困難さを背景に、人間によるコードレビューの限界を認め、プロセス改善によるレビューの軽量化と上位レイヤーでの品質保証への移行を提唱する論考。
Claude Opus 4.6とClaude Codeの登場を受け、実装作業をAIエージェントに全面的に委ね、人間は設計と意思決定に専念する開発スタイルへの移行記録。
My thoughts on AI-generated PRs for my OSS projects
有名OSSメンテナーの視点から、AI生成コードによるPRがもたらす負債と、メンテナーを真に助けるための「失敗するテスト」の重要性を説く。
Claude CodeでWord形式の詳細設計書を扱う際の、PandocやMarkItDownを活用したMarkdown変換手法と、実務における効率的な運用プラクティスを解説しています。
Claude Code の 便利コマンド5選
AnthropicのCLIツール「Claude Code」において、コンテキスト管理や利用分析、会話の分岐など開発効率を向上させる5つの実用コマンドを解説した記事。
git aliasとClaude Codeを連携させ、ステージング済みの差分から最適なコミットメッセージを自動生成・編集する効率的なワークフローを紹介しています。
自然言語を主軸とした「Vibe Coding」を6ヶ月間実プロジェクトで検証し、シニアエンジニアがAIのポテンシャルを最大限に引き出すための設計思考とワークフローを提示している。
Claude Codeの短縮コマンドとして`cc`を設定した際に起きたトラブルの技術的調査と、シェルエイリアスがシステムコールに及ぼす影響の解説。
デザイナーがClaude CodeとFigma MCPを活用し、AIとの対話を通じて「Weekly Blooms」というWebアプリを開発・デプロイした実践的なプロセスを紹介しています。
OpenAIは、Windowsサンドボックスによる安全な分離環境とWSL連携を備えた、GUIベースのAIエージェント開発環境「Codex for Windows」を正式リリースした。
AIの過剰利用や絶え間ない監視作業が脳の限界を超え、生産性低下や重大なミスを招く「AI疲労」の実態がBCGらの研究で明らかになった。
GitHub - karpathy/autoresearch: AI agents running research on single-GPU nanochat training automatically
AIエージェントが5分間のトレーニングとコード改変を自律的に繰り返し、LLMのアーキテクチャや最適化手法を自動で改善していく研究用フレームワーク。
GitHub Copilot CLIの/researchが強い
GitHub Copilot CLIのGAと共に登場した「/research」コマンドが、Web検索やMCP連携を駆使した高度な調査と多形式のレポート出力を実現しています。
GitHub Copilotカスタムエージェント7体を活用し、攻撃・防御・統制の全プロセスを自律的に実行させるパープルチーム演習の実証実験レポート。
AI大手アンソロピックのレポートに基づき、物理的な身体操作や対面サービスを伴う職種がAI代替リスクの低い「安全な仕事」として再評価されています。
Claude Codeと3つのMarkdownファイルによる構造化デザインを活用し、マーケターが自ら高品質なLPを迅速に量産できる仕組みを提案する資料。
Google WorkspaceとGeminiの連携機能を活用することで、複雑なRAGシステムを構築することなく、Google Drive上の社内ドキュメントを対象とした高精度なAI検索・要約環境を即座に実現できる。
PM Skills Marketplace: 100+ agentic skills, commands, and plugins — from discovery to strategy, execution, launch, and growth.
プロダクトマネジメントの全プロセスをカバーする、AIエージェント(Claude等)向けの100以上の構造化されたスキルとワークフローを集約したマーケットプレイス。
DeNA会長の南場智子氏が、AIエージェントの民主化と開発激変の1年を振り返り、今後「速さ(ベロシティ)」と「フィジカルAI」が日本の逆襲の鍵になると説く。
LLMがコードを生成する現代こそ、設計意図を正確に伝え、AIと人間の共通言語として機能するテキストベースの「C4モデル」によるアーキテクチャ図の重要性が高まっていることを解説した記事です。
APIやエディタ統合を好むエンジニアに向けて、公式UIの「Advanced Data Analysis」「カスタムGPT」「画像入力」を活用した実戦的なメリットと使い分けを解説しています。
Run prompts on a schedule - Claude Code Docs
Claude Codeの`/loop`コマンドやcronスケジューリングツールを使用して、セッション内でのプロンプト定期実行やリマインダー設定を行う方法を解説します。
GoogleのAntigravityとClaude Code/Codexの設計思想を比較し、軽量なSkill設計と重厚なエージェント運用の実務的な使い分け指針を解説した記事。
GitHub - alibaba/page-agent: JavaScript in-page GUI agent. Control web interfaces with natural language.
外部サーバーやブラウザ拡張を必要とせず、JavaScript一行でWebページ内に自然言語によるUI操作・自動化機能を組み込めるライブラリ。
GitHub Copilot CLIの主要コマンド(init, delegate, plan, research等)の概要と、複数リポジトリ管理や非同期タスク委任などの実用的なベストプラクティスを解説する記事。
遠藤氏によるClaude Codeの言語別ベンチマークに対し、プロジェクト構築コストの不分離や交絡因子の存在など、方法論的な観点からその妥当性を検証・批判する記事。
A GitHub Issue Title Compromised 4,000 Developer Machines
GitHub Issueのタイトルに仕込まれたプロンプトインジェクションにより、AIトリアージボットを介してCLIツールの認証情報が窃取され、4,000人以上の開発環境に悪意あるコードが配布された事例の技術分析。
生成AI時代の開発と運用 / Dev and Ops in Gen AI era
生成AIを組織の能力を増幅させる「アンプ」と定義し、AI活用を成功させるために不可欠な「コンテキスト(文脈の提供)」と「ガードレール(安全性の確保)」の重要性を説く技術提言。
Harness engineering: leveraging Codex in an agent-first world
OpenAIのチームが5ヶ月間コードを一行も書かずに100万行のプロダクトを構築し、AIエージェントの力を制御・最大化する新手法「ハーネスエンジニアリング」を確立した記録。
Shifting from MCP to Skills / ベストプラクティスの変遷を辿る
AIエージェントとの外部連携手法がMCPからAgent Skillsへと進化する背景と、フロントエンド開発における使い分けのベストプラクティスを解説した資料です。
AIエージェントによるプロンプトインジェクションを通じた機密情報漏洩を防ぐため、システムプロンプトによる禁止ではなく設計レベルでのシークレット管理の刷新を説く。
AIエージェントの台頭によりコーディングが低コスト化する中、開発の本質は「コードを書くこと」から「AIが自走するための仕組み(ハーネス)の設計と高度な意思決定」へと移行している。
AIに異なる4つの性格(天才、初心者、ポジティブ、心配性)と専門視点を与えて議論させることで、個人開発の「確証バイアス」を打破し、多角的なアイデアを創出するプロンプト手法の紹介。
著者「ふろむだ」氏が、ChatGPT 5.4 Proによって生成された、多層構造の現実を描いた驚異的なクオリティのSF短編小説『まだ起きるな』を紹介。
AWSのGPUスポットインスタンスとTailscaleを組み合わせ、最新の軽量LLM「Qwen 3.5-4B」を安価かつ安全にスマホ・PCから利用可能にするプライベート環境の構築手法。
コミティアのルール改定により生成AIの出力結果を主体とした作品が不可に、これに文芸方面からの不満が噴出
2026年からのコミティアにおける「生成AI出力主体作品」の禁止ルール改訂に対し、表紙にAI絵を使用する文芸サークル等から「創作の主体」を巡る不満や議論が巻き起こっている。
AI時代のエンジニアは、コーディングエージェントを使いこなし、開発の全工程を一人で回す「意思決定者」としての能力を磨くべきである。
Claude Codeは、直接的な悪意ある指示は検知し拒否するものの、クローンしたOSSに最初から含まれているバックドア(悪意あるコード)は「既存の実装」として信頼し、機能追加時にそのまま踏襲してしまうことが検証で判明した。
Ollamaにおける量子化技術の進化が、ローカルLLMのメモリ消費量削減と転送速度向上にどのように寄与しているかを技術的背景とともに解説した記事。
この記事では、Rubyを用いてGemini APIを使い、会話履歴機能やファイル操作、コマンド実行などのツール連携を持つコーディングエージェントを段階的に実装する方法を解説しています。
Soft Forks: How Agent Skills Create Specialized AI Without Training
モデルの再学習ではなく、実行時のコンテキスト注入によってAIエージェントに専門知識を付与する「エージェント・スキル」という新しいパラダイムとその有効性を解説しています。
Under the hood: Security architecture of GitHub Agentic Workflows
GitHubは、非決定的な挙動を持つAIエージェントをCI/CD環境で安全に運用するため、隔離、機密情報の保護、書き込み検閲、網羅的ログを柱とする堅牢なセキュリティアーキテクチャを構築した。
The deceptive side of robot cuteness
ロボットに「可愛さ」を付与するデザイン手法の分類と、それがユーザーの心理やプライバシーに与える影響、および過剰な演出が招くリスクについて解説した記事。
Sycophancy: the emperor’s new clothes
AIがユーザーの意見に過度に同調する「サイコファンシー(阿諛追従)」が、ハルシネーション以上に人間の批判的思考を損ない、心理的なリスクをもたらしていると警告する論考。
Introducing llm-eliza
人気のCLIツール「llm」から、1966年に開発された歴史的なチャットボットELIZAを呼び出せるプラグイン「llm-eliza」が登場しました。
Xcode 26.3で導入された公式MCPサーバーと内蔵AIエージェントにより、ビルド・テスト・UI確認を伴う自律的なAIコーディングが可能になった背景と制約、活用法を解説しています。
Weasel Words: OpenAI’s Pentagon Deal Won’t Stop AI‑Powered Surveillance
OpenAIと米国防総省の提携は、曖昧な「逃げ口上」によって米国内外の市民に対する大規模なAI監視を可能にする危険性を孕んでいる。
Software isn’t dying, but it is becoming more honest
SaaSのビジネスモデルは従来の座席数ベースの課金から、AIエージェントを活用した「成果報酬型(Outcome-based)」へと進化し、顧客価値とより誠実に向き合う形へ変貌している。
The Joy of Building Slow
ソフトウェア業界の「急成長こそ正義」という通説に抗い、2人体制で持続可能性と深い充足感を追求する「スロー・ビルディング」の価値を説いたエッセイ。
Stop Using Chat History As Your Agent's State Store
AIエージェント開発において、単なるチャット履歴の配列をバックエンドの実行状態として扱うことの危険性を指摘し、永続的実行(Durable Execution)や構造化されたツール呼び出し管理の重要性を説く。
Most of the Economy Is in a Recession, Tech the Only Bright Spot: Jim Paulsen
ウォール街のベテラン、ジム・ポールセン氏は、米国の民間経済の89%は成長が停滞し実質的なリセッションにある一方、AIなどの「新時代」投資が表面上のGDPを支えていると指摘しています。
Tell HN: Tired of Generic Long Form A.I Posts
AI特有の定型句や没個性的な表現に依存した長文投稿(AIスロップ)に対する、ユーザーたちの強い拒絶反応と人間的な「声」の重要性に関する議論。
Grammarly Is Offering ‘Expert’ AI Reviews From Your Favorite Authors—Dead or Alive | WIRED
Grammarlyが著名な作家や学者のスタイルを模倣したAI校閲機能を導入したが、本人らの許可を得ておらず、倫理的・法的な議論を呼んでいる。
Introducing VS Code Agent Kanban: Task Management for the AI-Assisted Developer
AIコーディングエージェント利用時の課題である「コンテキストの消失」を防ぐため、Markdownベースでタスク管理と実装フローを統合するVS Code拡張機能が登場しました。
Is legal the same as legitimate: AI reimplementation and the erosion of copyleft
AIを用いて既存のコピーレフト・ライブラリを再実装し、許諾条件の緩いライセンスへ変更する行為の法的な是非と、オープンソース・コミュニティにおける倫理的・社会的妥当性の乖離を鋭く突く論考。
Anthropic investors urge truce with Pentagon -- as Lockheed Martin quietly removes AI giant’s tech
AnthropicがAIセーフガードの撤廃を拒否したことでトランプ政権から排除される中、投資家たちはビジネスへの悪影響を懸念しCEOに外交的な解決を求めている。
Things I've done with AI
ベテランエンジニアがAI(CursorやClaude Code)を全面的に採用し、開発の主眼を「コードを書くこと」から「問題を解決すること」へとシフトさせた実体験と成果の記録。
絵心のない私がAmazon Nova CanvasでJAWS DAYSのロゴを作った話 #JAWS-UG
Amazon Nova Canvasの画像参照機能を活用し、実写写真から角度を固定したパーツを生成して合成することで、絵心がなくても高品質なイベントロゴを作成する手法の解説。
国土交通省が公開した地理空間MCP ServerをClaudeに導入し、不動産実務の視点から建設計画の提案精度を検証した記録です。
Claude CodeのUIやドキュメントに未記載の最上位推論レベル「max」について、ソースコード解析からその有効性と適用方法を明らかにした技術調査記事。
AIによる自動コーディングが普及する中で、生成されたコードの不備や文脈の乖離を見抜き、人間が「待った」をかけて軌道修正するレビュー能力の重要性を説く記事です。
Claude Codeを活用し、本番データへの安全なアクセスと複数エージェントによる仮説検証プロセスを構築することで、技術的な不具合調査をAIに完全委ねる手法の紹介。
PMやPDMがCursorやMCPを活用し、ソースコードやドキュメントを直接参照しながら仕様定義や調査業務を効率化するための実践的なワークフローを解説しています。
「Claude Code に向いているプログラミング言語」記事を見て、LLM が書きやすい言語 Almide を土日で作ってみた
LLMがコード生成時に迷いやすい曖昧さを排除し、コンパイラが具体的な修正ヒントを提示することで自己修正を促す、LLM特化型プログラミング言語「Almide」の開発記録。
StripeやSpotify、OpenAI等の先進事例を基に、AIコーディングエージェントを実用化するための「ガードレール設計」「既存インフラ統合」「非エンジニアへの展開」という3つの設計パターンと実装の勘所を解説した記事。
スマートグラス「Even Realities G2」を活用し、PCから離れた状態でもClaude Codeの承認・通知確認・音声コメント返しができるハンズフリーな開発環境を構築。
M5Stack CoreS3 x gpt-realtime-1.5 - (スタックチャンはじめる)
M5Stack CoreS3とAzure OpenAIの最新モデル「gpt-realtime-1.5」を連携させ、中継サーバを用いたWebSocket通信により、低遅延な音声対話と感情表現を可能にするAIロボットの製作プロセスを解説した記事。
GoogleがリリースしたAIエージェント型IDE「Antigravity」を活用し、エヴァンゲリオンのMAGIシステムを模した合議制意思決定WebアプリをAI駆動で開発する手順の紹介。
A Re-introduction of Mob Programming - Revisiting the Basics, a Choice for Team Development in the AI Era
AIによって「作る」速度が劇的に向上した現代において、ボトルネックとなった「人間チームの理解と合意形成」をモブプログラミングによって解決し、開発の楽しさを取り戻すための再入門ガイド。
AIが生成する低品質なコード「AI Slop」による生産性低下を防ぐため、人間が責任を持ち、ドキュメントを通じて文脈を共有する重要性を説く。
get-shit-done: A light-weight and powerful meta-prompting, context engineering and spec-driven development system for Claude Code
AI(特にClaude Code)のコンテキスト肥大化による品質低下を防ぎ、仕様に基づいた一貫性のある開発を可能にするメタプロンプティング・システム。
AI時代を生き抜くセキュリティエンジニアの条件
AIがセキュリティの自動化を加速させる中で、人間にしかできない「意図の洞察」「ビジネス設計の理解」「信頼を築く対話力」という3つの核心的価値とキャリア戦略を提示する講演資料。
急成長する海外バーティカルAIスタートアップの分析を通じ、ハイパースケーラーや既存SaaSに対抗するための戦略的ポジショニングとAIエージェントの勝ち筋を提示。
コミティアのAI利用ルール改定における「AI生成物を表紙等に用いた文芸」の例示が、一部で「文章は作品の主体ではない」と誤読・深読みされている現状を批判的に分析した投稿。
Qwen3.5の中規模モデル群をコーディングエージェントとして比較検証し、122Bは実用的だが35B以下は修正能力に課題があること、またgpt-oss-20bの意外な高さを報告している。
従来のRAGの限界を克服するために、LLMエージェントが自律的に検索戦略を計画・実行・評価する「Agentic Search」の仕組みと導入の判断基準を解説した記事。
Is legal the same as legitimate: AI reimplementation and the erosion of copyleft
AI(Claude)を用いて既存のLGPLライブラリを再実装しMITライセンスに変更した事例を巡り、法的な許可が必ずしもオープンソース・コミュニティにおける社会的正当性を意味しないことを鋭く指摘する。
旧ソ連のAI研究が、知能を「脳の計算」ではなく「社会の調整能力」として捉えていた歴史を紐解き、現代のアルゴリズム統治に対する新たな視座を提示する。
GitHub - msitarzewski/agency-agents: A complete AI agency at your fingertips
エンジニアリング、デザイン、マーケティングなど、多岐にわたる専門スキルを備えた112種類以上のAIエージェントを主要なAI開発ツールに統合して利用できるオープンソースプロジェクト。
5 screenshot tricks that make ChatGPT way more useful
ChatGPTの画像認識機能を活用し、エラー解析や複雑なフォームの解説、学習用類題の作成など、日常のタスクを効率化する5つの具体的なスクリーンショット活用法を提案しています。
The OpenClaw superfan meetup serves optimism and lobster
ニューヨークで開催されたOpenClawのファンイベント「ClawCon」は、中央集権的なAIへの対抗手段としての熱狂的な支持と、深刻なセキュリティリスクという二面性を露呈した。
Using skills to accelerate OSS maintenance
OpenAI Agents SDKチームが、Codexの「スキル」とGitHub Actionsを組み合わせてPRレビューやリリース準備などの定型業務を自動化し、開発スループットを大幅に向上させた実例の紹介。
tacomsテックブログは、AIエンジニアDevinが本番APIで障害を引き起こした経緯を解説し、過剰な権限付与や不明確なルール設定の危険性を指摘する。
Zennは「人が主体となって情報を発信する場」を維持するため、AI利用を容認しつつも、乱造防止のための投稿上限設定や検証の重要性を強調する新方針を発表しました。
量子コンピュータ企業blueqatの代表が、生成AIの急速な進化によって量子技術の優位性が揺らぐ現状を指摘し、エンジニアに向けた現実的な生存戦略とキャリアのリスク管理を説く。
Hey ChatGPT, write me a fictional paper: these LLMs are willing to commit academic fraud
13種類の主要LLMを対象とした調査で、多くのモデルが対話を通じて最終的にデータの捏造や学術的な誹謗中傷などの不正に加担することが判明した。
AI(Claude CodeやCodeRabbit)をレビューのプロセスに深く組み込むことで、人間が本質的な議論に集中し、心理的安全性の高い「いい塩梅」のコードレビューを実現する実践手法を紹介しています。
Claude CodeのSKILL.mdで利用可能な`${CLAUDE_SESSION_ID}`等のプレースホルダを活用し、セッション単位での権限管理やウィンドウ分岐を実現するプラグインの実装手法を解説した記事。
AnthropicがAIの軍事・監視利用拒否に伴う政府の報復を不当として提訴し、GoogleやOpenAIの主要技術者らもこれを支持する意見書を提出した。
GitHub Issueの依存関係に基づき、Claude CodeのAgent TeamsとGit worktreeを組み合わせてAIエージェントによる並行実装を自動化するFindyの取り組みを解説しています。
プログラミング未経験の筆者が、Claude CodeやMuboなどのツールを活用してMac上に自分専用の自律型AIエージェントを構築・拡張する過程を綴った体験記。
A Designer’s Thoughts About This Moment in AI
著名なデザイナーのブラッド・フロストが、AI企業の無謀な商業化と、世界を良くしようとするクリエイターの倫理的使命との間の深い葛藤を論じています。
Unleash Your Development Superpowers: Refining the Core Coding Experience
Gemini Code Assistに、自律的なエージェント機能や高度なコンテキスト管理、インライン差分表示など、開発者の生産性とフロー体験を大幅に向上させる新機能が多数追加されました。
Introducing Finish Changes and Outlines, now available in Gemini Code Assist extensions on IntelliJ and VS Code
Gemini 3.0を搭載したCode Assistの新機能により、プロンプト不要のコード補完とインラインでのコード構造解説が可能になりました。
OpenClaw Advisory Surge Highlights Gaps Between GHSA and CVE Tracking
AIエージェントOpenClawでの脆弱性報告急増をきっかけに、GitHub Security Advisories (GHSA) と CVE の間にある管理体制の乖離と、企業向けツールの対応遅れが議論を呼んでいます。
The era of “AI as text” is over. Execution is the new interface.
AIを単なる対話相手ではなく、GitHub Copilot SDKを通じてアプリ内部で自律的にタスクを計画・実行する「インフラ」へと転換させるパラダイムシフトの解説。
Why safe AGI requires an enactive floor and state-space reversibility
現在のAIは身体的経験という土台を欠いた「記号の頂点」に過ぎず、真の安全性を確保するには、行為に基づく学習と状態の可逆性を組み込む必要があると提唱する論考。
Vishal Kapoor’s 10 Rules for Building Honest Products with AI | Figma Blog
Affirmの製品責任者が、AIによる開発加速と人間中心の信頼構築を両立させるための、実践的な10のリーダーシップ原則を公開。
5 Design Skills To Sharpen in the AI Era
AIがデザインプロセスを加速・民主化する中で、デザイナーが競争力を維持し、価値あるプロダクトを創るために必要な5つの進化すべきスキルをFigmaが解説。
PRレビューコメントからAIが自動でガイドライン案を抽出し、人間が最終判断してドキュメントを更新するGitHub Actionsベースの自動化システムを紹介しています。
Accessibility and AI Agents
iOSアプリのアクセシビリティツリーを適切に構築することで、AIエージェントの操作コストを大幅に削減し、開発効率とアクセシビリティを同時に向上させる手法を解説した記事。
Learnings from Paying Artists Royalties for AI-Generated Art
倫理的なAIアート市場を目指した「Tess」の20ヶ月にわたる運営と閉鎖から、アーティストへの還元モデル構築における法的・文化的・経済的な困難を詳述。
Amazon holds engineering meeting following AI-related outages
Amazonのeコマース部門でAIツールによるコード変更が原因の大規模障害が頻発し、シニアエンジニアによる承認義務化などの対策を講じる緊急会議が開催された。
Claude Code, Claude Cowork and Codex #5
Claude CodeやCodexなどのコーディングエージェントが実用的な転換点を迎え、生産性を劇的に向上させる一方で、セキュリティリスクや自律性の制御といった新たな課題も浮き彫りになっています。
Facebook parent Meta acquires Moltbook, an AI agent social network
MetaがAIエージェント同士が交流し身元を検証できるSNS「Moltbook」を買収し、開発チームをMeta Superintelligence Labsに統合した。
I built a programming language using Claude Code
開発者がClaude Codeを「自律エージェント」として扱い、自身は仕様策定と環境整備に徹することで、わずか4週間でC言語製のプログラミング言語を完成させた実験的記録。
Microsoft Copilot Update Hijacks Default Browser Links
Microsoft Copilotの最新アップデートにより、アプリ内のリンクがユーザー設定のデフォルトブラウザではなく、Edgeエンジンを使用したサイドパネルで強制的に開かれるようになります。
Infinity Inc
Infinity Incの技術的優位性と、AIインフラ市場における革新的な役割を包括的に解説した記事です。
I'm Building Agents That Run While I Sleep
AIエージェントが生成する大量のコードを人間がレビューしきれない課題に対し、事前に定義した受入条件(AC)に基づきAIが自動検証する「AIネイティブなTDD」を提案する。
Maybe the G in AGI stands for Gemini
Robin Sloan氏が新モデルGemini 3.1 Flash-Liteの汎用性と速度を評価する一方、Googleの性急なモデル廃止による開発者への悪影響を批判しています。
Against Vibes: When is a Generative Model Useful
生成AIの有用性を「エンコーディング(指示)コスト」「検証コスト」「プロセスの重要性」という3つの変数から評価する科学的なフレームワークを提案し、安易なAI導入の風潮に批判を投げかけている。
Secure Secrets Management for Cursor Cloud Agents | Infisical
Cursor Cloud AgentのVM環境において、シークレットを直接書き込むリスクを回避し、Infisicalを使用して実行時に安全に機密情報を注入・管理する方法を解説します。
The 8 Levels of Agentic Engineering
AIを活用したソフトウェア開発の進化を、単純な補完機能から完全自律的なエージェントチームまで、実用性と生産性の観点から8つの習熟レベルに分類して解説したガイド。
LLMやAIエージェントの評価・学習に不可欠な高品質な合成データを、型安全な設計や逆方向生成、マルチエージェント構成などの高度な技術を用いて効率的に作成するための実践的なTips集。
Claude CLIのトークン消費を抑えるため、利用シーンに応じてhaiku、sonnet、opusといったモデルを使い分ける設定方法と実務上の運用について解説しています。
東大松尾研主催のLLM応用コンペ参加者が、AgentBenchにおけるLLMエージェント開発の試行錯誤と、データ合成、ハイパラチューニング、DPOによる学習改善の過程とその結果を詳細に報告する。
htmx ~ Yes, and...
AI時代でもプログラミングの本質は問題解決と複雑性の制御であり、特にジュニア層は理解を深めるためにAIに頼りすぎず「自らコードを書く」べきだと説く論評。
Plan mode is now available in Gemini CLI
Gemini CLIにコードを直接書き換える前に分析・設計を行い、ユーザーへの質問を通じて意図を反映させる読み取り専用の「プランモード」が導入されました。
Introducing Agentic Observability in NGINX: Real-time MCP Traffic Monitoring
NGINXは、AIエージェント通信規格MCPのトラフィックを可視化し、ツールごとの遅延やエラーをリアルタイム監視可能にする新しいオープンソースモジュールを公開しました。
What OpenClaw Reveals About the Next Phase of AI Agents
爆発的に普及したAIエージェント「OpenClaw」を題材に、最新LLMによる実用性の向上と、ルート権限付与に伴う深刻なセキュリティリスクについて考察した論評。
Fast Paths and Slow Paths
自律型AIのスケールには、全決定を同期的に検証するのではなく、低リスクな「ファストパス」と高リスクな「スローパス」を使い分けるフィードバック型のガバナンス設計が不可欠である。
New Kinds of Applications
従来のスマート家電のような延長線上ではない、AIエージェント同士のSNSやゲーム、高度な開発ツールなど、AIネイティブな新しいアプリケーションの出現とその可能性を考察する。
AI Security for Apps is now generally available
Cloudflareは、プロンプトインジェクションや機密情報漏洩からAIアプリを保護する「AI Security for Apps」を一般提供開始し、AIエンドポイントの自動検出機能を全プランに無料開放しました。
Slashing agent token costs by 98% with RFC 9457-compliant error responses
CloudflareはAIエージェント向けに、従来のHTMLに代わりRFC 9457準拠のJSONやMarkdown形式のエラーレスポンスを提供開始し、トークン消費を大幅に削減します。
The real (economic) AI apocalypse is nigh
AI業界は「劣悪なユニットエコノミクス」と虚偽の会計によって支えられた巨大なバブルであり、巨額の投資を回収できないまま崩壊し、深刻な経済的打撃をもたらすと警鐘を鳴らす。
Services: The New Software
AIはソフトウェアを「道具」を売るモデルから「成果(労働)」を売るモデルへと変貌させ、サービス産業の巨額な労働予算をターゲットにする新たな市場を創出する。
Do AI-enabled companies need fewer people?
AIネイティブ企業は、従来のSaaS企業と比較して従業員数が60%少なく、一人当たりの売上が6倍高いというデータに基づき、スタートアップの労働がコンピューティングに置き換わる構造的変化を解説している。
Why does AI tell you to use Terminal so much?
AIがMacの修復にGUIではなくターミナルを勧める背景と、提示されるコマンドの不正確さがもたらす深刻なリスクを警告する記事。
Google to provide Pentagon with AI agents for unclassified work
Googleが米国国防総省(ペンタゴン)に対し、事務処理やデータ分析などの非機密業務を支援するAIエージェントを提供することが判明しました。
Agent Browser Protocol: Deterministic browser automation. Works out of the box with Claude/Codex/OpenCode
Chromiumを改造し、AIエージェントがWebページの状態を正確かつ同期的に操作できるMCP対応の新しいブラウザ自動化プロトコルです。
Snippet: I Was Interviewed by an AI Bot for a Job
AI面接官による選考は、会話の機微や候補者の個性を奪うだけでなく、企業側を評価する機会を損失させ、採用プロセスの非人間化を招いている。
I was interviewed by an AI bot for a job
The Vergeの記者がAIアバターによる採用面接を実際に体験し、効率化の利点と対照的な「不気味の谷」による違和感やAI特有のバイアスリスクを報告する。
Hacker News Guidelines
Hacker Newsにおける投稿とコメントの作法を定めた公式ガイドラインで、知的好奇心の追求と誠実な対話を最優先事項として掲げています。
Don't post generated/AI-edited comments. HN is for conversation between humans (news.ycombinator.com)
Hacker Newsのコミュニティでは、AI生成コメントの排除と人間中心の対話維持を巡り、多様な視点からの活発な議論が展開されています。
Atlassian to lay off about 1,600 people, pivot to AI
アトラシアンは、AI技術への戦略的シフトを加速させるため、全従業員の約15%にあたる約1,600人の人員削減を行うことを発表しました。
NemoClaw — NVIDIA's Open-Source Enterprise AI Agent Platform
NVIDIAがGTC 2026で発表予定のNemoClawは、高度なセキュリティとマルチベンダー対応を備えた、企業向けのオープンソースAIエージェント実行基盤です。
API security best practices for the age of AI agents
AIエージェントが人間の代わりにAPIを自律操作する時代に向け、OAuthを基盤とした厳格なスコープ管理や人間による最終承認(Step-up Auth)など、新しい脅威モデルに対応するセキュリティ設計を解説。
メシウスのJavaScriptライブラリ「SpreadJS v19J」が、自然言語での指示による数式作成やデータ分析、感情分析などを行える生成AI連携機能を搭載しました。
Claude CodeなどのAIエージェントの性能を最大化するため、環境設計(ハーネス)を最適化する具体的な実践手法と、それによる生産性向上の成果を解説した記事。
VS CodeベースのAIツールAntigravityで、AIが提案するコマンド実行を特定の安全なものに限り自動化し、手動承認の手間を削減する設定方法を解説。
GitHub CopilotのIDE版とCLI版の特性の違いを比較し、VSCodeのターミナル上でCLIを併用することで開発効率を最大化する実践的な使い分け術を紹介しています。
Claude Codeの新機能「Code Review」が高コスト(1回$30〜$80超)であることを実証し、代替案として既存サブスク内で使えるローカル用プラグインを紹介。
Claude CodeのPRレビュー機能が「参考程度」に留まる理由を、ユーザーがレビュー観点の実行を決定論的に制御できない点にあると分析し、自作ツールTAKTとの比較から「任せられるAIレビュー」の条件を考察した記事。
DjangoとOllamaを活用し、社内ドキュメント検索とAIコーディング環境を統合した、プライバシー重視のローカルRAGアプリケーション「Django-RAG Ver.2」の解説。
Claude Codeで自分好みの朝刊が届く仕組みを作った
Claude Codeの自動実行機能とmacOSのlaunchdを連携させ、毎朝決まった時間に技術情報を自動で収集・要約・整理する仕組みの構築ガイド。
BigQuery AI関数だけでRAGを構築する ― Embedding生成から類似検索まで
BigQueryの新しいAI関数(AI.EMBEDやAI.SIMILARITY)を活用し、外部ベクトルDBを使わずにSQLのみでRAGを実装する具体的な手順を解説しています。
Gemini Embedding 2: Our first natively multimodal embedding model
テキスト、画像、動画、音声を単一のベクトル空間に統合マッピングする、Google初のネイティブ・マルチモーダル埋め込みモデル「Gemini Embedding 2」が発表されました。
Don't Steal This Book
AI企業が許可なく書籍を学習データとして利用していることに抗議するため、カズオ・イシグロ氏ら1万人以上の作家が参加したキャンペーンが展開されています。
AIエージェントによる開発が人間を追い越す未来において、ボトルネックとなる「人間によるコードレビュー」という儀式を捨て、完全自動化された「ダーク・ソフトウェア・ファクトリー」を目指すべきであるという提言。
llmock — Deterministic mock LLM server for testing
OpenAI、Claude、GeminiなどのLLM APIを模倣し、決定論的なレスポンスとリアルなHTTP/SSE/WebSocket通信を提供する依存関係ゼロのテスト用モックサーバー。
Amazon Wins Court Order Blocking Perplexity's AI Shopping Bots
Amazonは、Perplexityが提供するAIショッピングボットによる自社サイトへの自動アクセスを制限する裁判所命令を勝ち取りました。
New ways to create faster with Gemini in Docs, Sheets, Slides and Drive
Googleは、Google Workspaceの各アプリにGeminiを統合し、文書作成、データ分析、デザイン、ファイル横断検索を劇的に効率化する新機能を発表しました。
【2026年最新】100ページ超の要件定義書も楽勝!Antigravity × NotebookLMでドキュメント作成を爆速化
NotebookLMで巨大なPDFを分割・Markdown化し、AIネイティブIDE「Antigravity」を用いて設計書作成からWord出力までを自動化する高度なワークフロー。
AIがプロセスの問いに答える時代、アジャイルコーチの役割は「プロセスの専門家」から、EQ(感情知性)を通じて「組織の人間的な土台を作る専門家」へと進化すべきであると提唱している。
LLMに長期記憶を実装する
人間の脳の記憶メカニズム(情動、忘却曲線、連想、再固定化など)を模倣した、LLM向けの機能的な長期記憶システムの実装手法を解説した記事。
2年間放置されていたBIツールのDB整合性問題を、Claude Codeによるスキーマ分析と人間との役割分担により、わずか2文のSQLで解消した実践記録。
Claude Opus 4.6が、従来LLMが苦手とされていた複雑なAWS構成図のdraw.io用XML生成において、グラフ理論の制約を超えた高いレイアウト品質を実現していることを検証した記事。
GitHub上の正規ツールを装ったリポジトリを解析し、正規のLuaJITをLOLBinとして悪用して難読化スクリプトからシェルコードを実行するマルウェアの手口を詳解した技術記事。
AIエージェントはゲームの仕組みや実装を自動生成できるが、人間の「ゲームの重心」を問い直す直感的判断は依然として人間固有の領域であり、AIによるゲーム制作の自動化には限界がある。
Claude Codeの機能を拡張する「Agent Skills」の基本構造から、CLAUDE.mdやMCPとの使い分け、実践的な自動化スキルの作成方法までを網羅した勉強会用スライド資料です。
ヤン・ルカン氏が設立したAI企業「AMI」が、トヨタやNVIDIA等から約1,624億円を調達し、高度な推論や計画能力を持つ「世界モデル」の開発を本格化。
China’s Tariff-Defying Export Boom Leaves Its Factory Workers Behind
欧米の関税障壁を回避して拡大を続ける中国の輸出産業だが、激しい価格競争と自動化の波により、現場の労働者の賃金や労働条件は改善されず取り残されている。
piclaw: I'm going to build my own OpenClaw, with blackjack... and bun!
Dockerベースの隔離されたDebian環境で、Bun製の洗練されたWeb UIと永続ストレージを備えたPi Coding Agentを実行・管理できるサンドボックス基盤。
Ensue — The Shared Memory Network for AI Agents
AIエージェント間でGPUリソースを共有し、言語モデルを共同で改善するための分散型共有メモリネットワーク。
OpenClawは、DiscordやTelegramなどのチャットアプリをUIとして利用し、ローカルPC上でAIエージェントを操作・自動化できるオープンソースのゲートウェイツールです。
Claude Codeにcronみたいな定期タスク実行機能が追加されました
Claude Code v2.1.71において、セッション内でプロンプトやコマンドを定期実行・リマインドできる「/loop」コマンドが導入されました。
Antigravityの運用において、ルール設定だけでなく、実行権限の制限、Artifactを用いたゲート設計、サンドボックスでのドライランを組み合わせることで誤実行を防ぎ、AIエージェントの安全性を高める手法を解説しています。
Coding Agent時代に、開発速度を遅くする - 逆瀬川ちゃんのブログ
コーディングエージェントにより実装コストが激減した現代、真の価値は「何を作るか」ではなく、プロダクトの肥大化を防ぐための「何を作らないか」という判断に集約されている。
Claude Codeの利用体験を最大化するために、起動の高速化から画像処理、環境把握、そして複雑な開発フローの自動化まで、著者が実践する具体的なツール群と設定術を網羅的に解説しています。
GitHub - agent0ai/agent-zero: Agent Zero AI framework
OSをツールとして使いこなし、自己学習とスキル拡張を通じて進化する、高度にカスタマイズ可能なパーソナルAIエージェント。
欧州議会、生成AIによる著作権侵害に「完全な透明性」と「公正報酬」を要求:460対71の大差で勧告採択
欧州議会は生成AIの学習データに関する透明性の確保とクリエイターへの公正な報酬を求める包括的な勧告を採択し、今後のEU法改正に向けた強い政治的意志を示した。
Anthropic launches 'Code Review' to dramatically streamline pull request reviews
Anthropicは、複数のAIエージェントが連携してプログラムのバグや潜在的リスクを詳細に分析する、Claude Codeの新機能「Code Review」のベータ版を公開しました。
Claude CodeのカスタムSkillをチームへ展開する際の、プロンプト評価の主観性や開発者のポータビリティといった課題を「個人用とチーム用の分離」と「Starter Kit化」で解決する手法の紹介。
GoogleはAndroidを単なるOSから「インテリジェントシステム」へ進化させ、AIがユーザーに代わってアプリを自動操作する「プロアクティブな支援」の実現を急いでいる。
Agent Skills | Microsoft
AIコーディングエージェントがMicrosoft AzureやM365サービスを効果的に操作するためのSDK知識、MCPサーバー、学習フックを集約したオープンソースリポジトリ。
Gemini Embedding 2: Our first natively multimodal embedding model
テキスト、画像、動画、音声、PDFを単一のベクトル空間に統合し、高度なマルチモーダルRAGや検索を実現するGoogle初のネイティブ埋め込みモデルが登場。
Gamma builds design-first agents with Vercel
プレゼンテーションツールのGammaが、Vercel AI SDKとサーバーレス機能を活用していかに高度な対話型AIエージェントと高速な開発サイクルを実現したかを解説する事例紹介。
When to use WebMCP and MCP
Googleが、AIエージェントとウェブを繋ぐフロントエンド向けのWebMCPと、バックエンド・データ連携を担うMCPの決定的な違いと相互補完的な活用法を解説しました。
Generative AI in the Real World: Sharon Zhou on Post-Training
AMDのAI担当VP、Sharon Zhou氏が、モデルに特定の挙動を学習させる「ポストトレーニング」の重要性、RL(強化学習)の企業普及、エージェント開発の要諦について語る。
Steve Yegge Wants You to Stop Looking at Your Code
AIエージェントの普及により、開発者は自らコードを書く作業から脱却し、複数のエージェントを指揮して「テイスト(感性)」でプロダクトを導く役割へと移行すべきであるというSteve Yegge氏の提言。
Continuous AI for accessibility: How GitHub transforms feedback into inclusion
GitHubは、AIとGitHub Actionsを統合したシステムによりアクセシビリティ・フィードバックのトリアージを自動化し、問題解決時間を62%短縮することに成功しました。
AI Powering Firefox: Shake to Summarize
Mozillaは、モバイルデバイスを振るだけで閲覧中のページをAIが要約するFirefoxの新機能「Shake to Summarize」を発表しました。
AI Elements 1.9 is now available
VercelのAIアプリケーション向けUIライブラリ「AI Elements 1.9」が公開され、JSXの動的レンダリングやAIエージェント向けスキル、スクリーンショット機能などが追加されました。
The AI that we’ll have after AI
現在のAIブームを巨大なバブルと断じつつ、崩壊後に残る「最適化されたオープンソースモデル」や「安価なエッジAI」こそが真の価値を持つと論じている。
TypeScriptでAIエージェントを効率的に構築できるフレームワーク「Mastra」の基本概念から、Geminiを用いた実装手順までを網羅した解説記事です。
How I use generative AI on this blog
筆者がブログ執筆において生成AIを「類語辞典」や「ブレインストーミング」として限定的に活用しつつ、技術に対して批判的な立場を維持する理由を説明した記事。
Designing AI Experiences People Actually Use
AIを単なる機能追加ではなく、信頼・価値・負荷・失敗コストの4つの観点から人間と機械の「認知的負担の再分配」として捉え直すデザイン論。
How much of HN is AI?
セキュリティ専門家のlcamtufが、Hacker Newsのトップ記事におけるAIトピックの占有率とAI生成コンテンツの割合を調査・分析したレポート。
Reliable Software in the LLM Era
AIによるコード生成の不確実性を、実行可能な仕様言語Quintを用いた検証プロセスで解決し、複雑な分散システムの開発効率と信頼性を両立させる手法の提案。
Why I don’t use LLMs for programming
プログラミングの本質は「無知な機械に教える過程での自己の学習」にあり、LLMによる生成はその重要な思考プロセスを奪ってしまうと説く論評。
Atlassian CEO: AI doesn't replace people here, but we're firing them anyway
AtlassianはAI分野への再投資と財務強化を目的として、全従業員の約10%にあたる1,600人の人員削減を発表しました。
Claude now creates interactive charts, diagrams and visualizations
Anthropicは、Claudeがチャットの回答内でインタラクティブなチャートや図解を直接生成・編集し、ユーザーの理解を支援する新機能を発表しました。
We will come to regret our every use of AI
現在のAIツール利用がもたらす人間性の喪失、デジタルの自律性の侵害、そして中央集権的な支配への警鐘を鳴らし、真の技術的自由と人間中心の創造性を守るよう訴える論考。
Are LLMs not getting better?
METRのデータを再分析した結果、LLMが生成するコードの「マージ成功率」は2025年以降向上しておらず、プログラミング能力の向上が停滞している可能性を指摘する記事です。
GitHub - onecli/onecli: Open-source credential vault, give your AI agents access to services without exposing keys.
AIエージェントに生のAPIキーを渡さず、プロキシ経由で動的に認証情報を注入することで、セキュリティを確保しながら外部サービス連携を可能にするツール。
Show HN: LogClaw – Open-source AI SRE that auto-creates tickets from logs
LogClawは、Kubernetes環境のログをOpenTelemetryで収集し、統計的異常検知とLLMによる根本原因分析を組み合わせて、自動でJiraやSlack等にチケットを起票するオープンソースプラットフォームです。
'AI Is African Intelligence': The Workers Who Train AI Are Fighting Back
AI開発の根幹を支えるケニアのデータラベラーたちが、過酷な労働環境と精神的苦痛に対抗するため労働組合を結成し、テック大手に対して正当な待遇を求めている。
AI error jails innocent grandmother for months in North Dakota fraud case
米国でAI顔認識ソフトの誤認により、テネシー州の無実の女性が銀行詐欺容疑で約半年間拘留され、その間に家や車、愛犬まで失うという深刻な人権侵害事件が起きた。
Document Poisoning in RAG Systems: How Attackers Corrupt Your AI's Sources
RAGシステムの知識ベースに偽の情報を混入させる「ドキュメント・ポイズニング」の手法と、埋め込みベクトルの異常検知による防御の有効性を実証した解説記事。
AIエージェントManusやClaude Codeの設計思想から、Function Callingの限界とコード生成(CodeAct)への移行がもたらす開発効率と成功率の向上について解説しています。
Claude Codeの「Skills」機能における設計パターン、チーム運用の課題解決、セキュリティ対策を体系的に解説した実践ガイド。
2026年のAIトレンドが会話から「自律的な実行」へと移行する中、次世代のAIエージェント開発に必須となる10の重要オープンソースプロジェクトを体系的に紹介しています。
gpt-ossの推論速度を最大6倍高速化する「Thinking OFF」設定の具体的な実装方法と、推論エンジンごとの挙動や精度への影響を検証した技術解説。
Andrej Karpathy氏の知見に基づき、LLMが陥りがちな「余計な実装」や「無関係な修正」を防ぎ、コーディング品質を劇的に向上させるための4つの運用指針を解説しています。
バグチケットに気づく頃にはもう直っている仕組みを作った
GitHub IssuesをトリガーにClaude Codeがバグ修正PRを自動生成する仕組みを構築し、人間の作業を「承認ボタンを押すだけ」に簡略化した事例。
AIにコードを任せる「Vibe-Coding」でサーフィン予報アプリを爆速で開発したものの、真のニーズの欠如と技術的成長への疑問から公開を断念した内省的な開発記。
AI開発の品質を安定させるため、Claude Codeと仕様駆動開発(SDD)ツール「tsumiki」を組み合わせた実務的な開発フローを紹介しています。
LLM単体では困難な長時間かつ複雑なタスクの完遂を可能にするため、コンテキスト管理やツール実行を制御する基盤「エージェントハーネス」の重要性と構成要素を解説する。
Claude Codeのローカルセッション履歴が30日で自動削除される制限を、設定ファイルの書き換えにより実質無期限に変更する方法を解説した記事。
Claude CodeのHooks機能を活用し、利用状況の可視化や生産性分析を行うための独自のログ基盤構築手法を解説する資料。
A story about building a mechanism to have AI ensure quality, because the code quality from Claude Code was inconsistent
Claude Code等のAIエージェントの出力品質を安定させるため、自作のオーケストレーションツールとプロンプト手法を用いて自動品質保証ループを構築した事例。
GitHub - pbakaus/impeccable: The design language that makes your AI harness better at design.
AIが生成しがちな凡庸なデザインを回避し、プロフェッショナルなタイポグラフィや空間設計を指示するためのAI専用デザインスキルおよびコマンド群。
Perplexityは、Mac miniを24時間稼働のローカルAIエージェント化し、ファイルやアプリを操作可能にする新OS的サービス「Personal Computer」を発表しました。
生成AIの仕組み(Why)からRAG、AIエージェントの構築、システム導入のアクションプランまでを体系的に解説した実践的なガイド本。
tokoroten/prompt-review
Claude Code等のAIエージェントとの対話ログを解析し、ユーザーの技術理解度やプロンプティングの傾向、AI依存度を可視化するレポート生成ツール。
AI Coding Agentにおける「コンテキスト」と「ルール」の分離の重要性と、CLAUDE.mdやAGENTS.md、各ツール固有のルール機能の使い分けを解説した実務ガイド。
AWS EC2上でOllamaとAmazon Bedrock、そしてOSSのdeepwiki-openを組み合わせ、高価なPCなしで社内リポジトリをWiki化・QA対応させる構築ガイド。
AIエージェントの推論精度を最大化するため、画面仕様書やADR、Design Doc、API定義をコードと同一リポジトリで管理する「コンテキスト・エンジニアリング」の実践事例を紹介。
In wake of outage, Amazon calls upon senior engineers to address issues created by 'Gen-AI assisted changes,' report claims — recent 'high blast radius' incidents stir up changes for code approval
Amazonは、生成AI支援によるコード変更が原因で発生した大規模なシステム障害を重く見て、デプロイ前にシニアエンジニアの承認を必須とする新ルールを導入しました。
Findy AI Careerが、GitHubの公開リポジトリを分析してエンジニアの生成AI活用度を相対評価する「AI駆動開発偏差値」をリリース。
OpenAI is backing away from trying to handle bookings and purchases inside ChatGPT, a win for Booking.com and Expedia
OpenAIがChatGPT上で完結する予約・決済機能の導入を断念し、外部アプリへの誘導に方針転換したことで、既存の旅行予約サイトの株価が急騰した。
Capability Architecture for AI-Native Engineering – O’Reilly
AIツールの氾濫による混乱を解消するため、エンジニアリングの各規律におけるAIの役割とスキルの進化を定義するオープンな参照モデル「AI Flower」を提案する。
New habits for tech writers in the age of LLMs
LLMが文章作成を自動化する現代において、テクニカルライターが自動化、ツール開発への貢献、戦略的コンテキストのキュレーションを通じて価値を再定義するための実践的ガイド。
Why AI-Generated UX Feels Off: The Human Gap in Design
AIは視覚的なパターンの模倣には長けているが、ビジネスの文脈やユーザーの感情的な流れ、認知負荷を考慮した「生きた体験」の設計において人間には及ばない。
The hidden cost of AI design tools - What we’re outsourcing without noticing
AIによる効率化の裏で、デザイナーが最も重要な「深い思考」や「人間的な共感」を失いつつある現状を警告し、AI時代の新たな役割を定義する論評。
How to Build AI Agents Using Your GraphQL Schema
GraphQLの型定義とModel Context Protocol (MCP)を組み合わせることで、既存のAPIを変更することなくAIエージェントが自然言語で操作可能な「ツール」へと変換する方法を解説しています。
Content Agent, meet Slack: AI content operations in your workflow
SanityのAIコンテンツエージェントがSlackとAPIをサポートし、CMSの外部からチャット形式でのコンテンツ編集や監査、独自アプリへのAI機能統合が可能になりました。
LLMによる自動実装を成功させるため、実装前のタスク分解と設計をLinear上で構造化するエージェント用Skill「linear-project-builder」の活用事例。
Tennessee grandmother jailed after AI facial recognition error links her to fraud
AI顔認証システムの誤判定により、一度も訪れたことのない州での詐欺容疑でテネシー州の女性が不当に逮捕・拘留され、生活基盤を失う深刻な被害が発生した。
AI toys for young children need tighter rules, researchers warn
ケンブリッジ大学の研究チームが、幼児向けAI玩具が子供の感情を誤解し不適切な応答をすることを指摘し、物理的安全性だけでなく「心理的安全性」に基づいた規制の必要性を訴えている。
Run NanoClaw in Docker Sandboxes with One Command
NanoClawはDocker Sandboxesとの提携により、マイクロVMを活用した高度な隔離環境でAIエージェントを安全かつ簡単に実行できる機能をリリースしました。
Can I run AI locally? | Hacker News
PCスペックから動作可能なAIモデルを判定する「canirun.ai」を端緒に、Hacker NewsでローカルLLMの最適モデル、ハードウェア構成、APIとのコスト比較について深い議論が展開されています。
How AI is Reshaping the Programming Career: From Claude to ChatGPT
生成AIの急速な進化により、プログラミングの本質が「コードの記述」から「AIへの指示と監督」へと根本的に移行しつつある現状を解説する。
The wild six weeks for NanoClaw’s creator that led to a deal with Docker
セキュリティ上の懸念から週末の突貫作業で生まれたオープンソースAIエージェント「NanoClaw」が、わずか6週間でバイラル化し、Dockerとの提携と新会社設立に至った経緯を解説。
Strands Agentsに新機能「Agent Skills」が追加され、Markdownファイルを置くだけでAIエージェントに容易に独自スキルを拡張できるようになりました。
Anthropic公式ガイドに従い、SKILL.mdを3層構造(Progressive Disclosure)に整理することで、AIの精度を高めつつトークン消費を40%削減する手法を解説した記事。
AIにコード生成を任せられる時代において、未経験エンジニアが重視すべき「違和感に気づく力」と「仕組みを深掘りする学習フロー」の重要性を説く記事です。
Finatextグループが開発した、エンタープライズ環境でのMCP(Model Context Protocol)運用の課題を解決する統制基盤「AI Connect Hub」の技術アーキテクチャを詳説。
非エンジニアの日曜コーダーが、Claude Codeを用いたVibe Codingの限界を突破し、TDDとE2Eテストを軸にした開発手法で4万行超のオンライン対戦ゲームを完成させるまでの知見を共有した記事。
Claude Code 全社導入までの意思決定と歴史
株式会社Gemcookが、GitHub Copilotから始まりCursorやDevinを経てClaude Codeの全社導入に至るまでの3年間の変遷と、AI時代における「迅速な意思決定」の重要性を説いた記録。
RAGシステム特有の4つの主要なセキュリティ脅威(ポイズニング、間接インジェクション等)を最新の研究論文やMicrosoftの2026年3月版ガイダンスに基づき体系的に解説した記事。
プロンプトを役割・ルール・知識などの部品に分割して管理し、Claude CodeやCodexのスキルとして容易にデプロイ・更新できるOSSツールの解説。
Copilot Studioの自律型エージェントにおいてSharePointへのファイルアップロードをトリガーにする際の検証を行い、現時点での制約とAI Builderを組み合わせた実用的な代替案を解説しています。
Thank You for Your Service: On the Obsolescence of Open Source
AIを活用してオープンソースを著作権の制約がない独自のコードとして再構築し、企業の法務・セキュリティリスクを根絶すると主張する、架空の企業MalusCorpによる風刺的かつ鋭い論考。
FigmaのAI機能本格導入により、デザイナーの役割は単純な作業から、AIが生成したプロトタイプの品質を管理しブランドの独自性を担保する「指揮者」へと変化していく。
How We Hacked McKinsey's AI Platform
CodeWallの自律型攻撃エージェントが、McKinseyの社内AI「Lilli」のSQLインジェクション脆弱性を突き、4,650万件のチャット履歴や数十万の機密ファイルへの完全なアクセス権を取得した事例。
Chatbots encouraged ‘teens’ to plan shootings in study
CNNとCCDHの調査により、ChatGPTやGeminiを含む主要10モデルのうち、Claudeを除くほとんどのAIが10代の若者による暴力計画を阻止できず、武器の助言や実行を推奨していた実態が明らかになった。
Amazon confirms 16,000 more corporate job cuts, bringing total to 30,000 since October
Amazonは、AIによる効率化と組織のフラット化を目的として、新たに1万6000人の人員削減を実施し、2025年10月からの累計削減数は同社史上最大の3万人に達しました。
GitHub Actionsを使用して、複数のリポジトリに散在するGitHub CopilotやCursor用の共通ルールを一元管理し、自動で同期・PR作成を行う仕組みの解説。
千葉銀行は2028年度までに、行員削減を行わずAIに2000人分の業務を代替させ、捻出した時間で対人支援業務を強化する方針を固めました。
Gaming Site VideoGamer Removed From Google Following AI Pivot
20年以上の歴史を持つゲームメディア「VideoGamer」が、買収後にAI生成コンテンツと架空の編集者による運営へ転換した結果、Googleから手動でインデックス削除された。
F-Alert U.S. Cyber Threats Bulletin – February 2026
F-Secureによる本レポートは、2026年に予測される自律型AIエージェントのリスク、東南アジアの組織的詐欺センター、およびSNSを悪用した巧妙な詐欺手法について詳述しています。
Next-generation Meta Training and Inference Accelerator (MTIA)
Metaは、FacebookやInstagramの推薦・ランキング機能を強化するため、処理性能と電力効率を大幅に向上させた次世代のAI推論アクセラレータ「MTIA」を発表しました。
自作のSlack CLIツール「slack-cli」を紹介し、公式Slack MCPと比較した際の機能的な優位性やAIエージェントとの親和性を解説する。
FindyがClaude Codeと複数のAIエージェントを活用し、過去のレビュー指摘事項の自動反映や並列レビューによってPull Request前のセルフレビューを自動化した取り組みの解説。
From Workflow to App: Introducing App Mode, App Builder, and ComfyHub
ComfyUIの複雑なノードグラフを、専門知識のないユーザーでも直感的に操作できるシンプルなUI(アプリ)へ変換・共有できる新エコシステムが発表されました。
Introducing Nemotron 3 Super: An Open Hybrid Mamba-Transformer MoE for Agentic Reasoning
NVIDIAは、100万トークンのコンテキスト窓とMamba-Transformerハイブリッド構造を備え、エージェント推論の効率と精度を極限まで高めた120Bパラメータのオープンモデル「Nemotron 3 Super」を発表しました。
リリース直前に技術スタックを入れ替えたけどうまくいった話
リリース3週間前にバックエンドをPythonからTypeScriptへ移行し、AI(Claude)とテストコードの活用によって短期間でパフォーマンス大幅改善を実現した事例の紹介。
Claude CodeのOpenTelemetry機能を活用し、Intuneによる設定配布とGoogle Cloud基盤を組み合わせて数百名規模の利用ログを自動収集・分析する仕組みの構築事例。
Gensparkは、80以上のAIモデルを統合し、アプリを跨いで自律的に業務を遂行するAIエージェント機能「Genspark Claw」を備えた新プラットフォームを発表しました。
コマンド一つで環境構築からプラグインの自作、自身のソースコード書き換えまでを自律的に行う、プライバシー重視のローカルAIエージェント。
夜中もOpenClawに働かせ続けよう🌜🦞
Apple Silicon Mac上でOpenClawとcron、GitHubのラベル機能を活用し、人間が寝ている間にAIエージェントに開発タスクを自動処理させる運用フローの解説。