## LLMは「偉大な詩」を書けるのか：技術的洗練と「偉大さ」の境界線

概要

https://hollisrobbinsanecdotal.substack.com/p/llm-poetry-and-the-greatness-question

詳細内容

## LLMは「偉大な詩」を書けるのか：技術的洗練と「偉大さ」の境界線 https://hollisrobbinsanecdotal.substack.com/p/llm-poetry-and-the-greatness-question **Original Title**: LLM poetry and the "greatness" question LLMが技術的洗練を超え、文化的文脈に根ざした真の「偉大さ」を獲得できるかを、相反する2つの開発手法から考察する。 **Content Type**: 🔬 Research & Analysis **Language**: en **Scores**: Signal:5/5 | Depth:4/5 | Unique:5/5 | Practical:3/5 | Anti-Hype:5/5 **Main Journal**: 62/100 | **Annex Potential**: 64/100 | **Overall**: 88/100 **Topics**: [[LLM, 創造性, プロンプトエンジニアリング, RLHF, 評価指標]] LLMによる詩作能力が向上し、韻律や比喩などの「技術」はすでにプロレベルに達している。しかし、著者は「技術的に優れた詩」と「偉大な詩」の間には決定的な境界線があるとし、その境界を突破しようとする2つのアプローチを比較・検証している。 1つ目は、著名なAI研究家Gwernによる「職人芸的」なアプローチだ。彼は、RLHF（人間によるフィードバックからの強化学習）がLLMを「無難で退屈な回答（モード崩壊）」に追い込んでいると指摘する。これを打破するため、彼は多段階の推論プロンプト（ブレインストーミング、10以上の方向性の提示、自己批判、編集、再起稿のループ）を構築した。この手法は、詩人がゴミ箱に下書きを捨てながら推敲するプロセスを再現しており、単なるパターン生成ではなく、形式的な制約を「圧力釜」のように利用して創造性を引き出そうとする。著者は、このコラボレーションによる手法こそが、AIに「偉大さ」をもたらす可能性が最も高いと評価している。 2つ目は、スタートアップMercorによる「スケーリング」重視のアプローチだ。彼らは熟練した詩人に時給150ドルを支払い、RLHFのためのデータを作成させている。ここでの目的は詩そのものではなく、詩作という「正解のない主観的な判断」が必要な領域でモデルを訓練することにある。詩人を満足させられるモデルなら、法務や医療といった専門的な「判断」も模倣できるという算段だ。しかし著者は、この手法は「読者の嗜好の平均値」への回帰を数学的に強制するものであり、芸術に不可欠な「奇妙さ（strangeness）」を削ぎ落としてしまうリスクがあると警告する。開発者にとっての重要な示唆は、LLMの出力品質を「平均的なユーザーの満足度」で評価し続ける限り、専門家レベルの深みや独創性には到達できないという点だ。真の「偉大さ」や専門性を追求するには、単なる報酬モデルの最適化（Mercor的手法）ではなく、ドメイン固有の制約と批判的思考を組み込んだ多段階のワークフロー（Gwern的手法）が不可欠であると、著者の分析は示している。

元記事を読む他のサマリーを見る