My Answer is C: First-Token Probabilities Do Not Match Text Answers in Instruction-Tuned Language Models

この記事に関するIssueをGithubで作成する

Machine-guided design of cell-type-targeting cis-regulatory elements

この論文は、機械学習を用いて細胞型特異的なCis-reguratory elements（CREs）を設計し最適化する新しい方法を提案している。研究者らは、Massively Parallele Reporter assay（MPRA）データを使用してCNNベースのモデル「Malinois」を訓練し、このモデルを用いて細胞型特異的なCREsを予測した。さらに、配列最適化フレームワーク「CODA」を開発し、in vitroおよびin vivo実験でその有効性を実証した。

Adapting Large Language Models to Domains via Reading Comprehension

この論文では、ドメイン特化の生データを読解テキストに変換する新しい手法を提案し、生物医学、経済、法律などの分野での能力向上と汎用的なプロンプト対応能力の獲得を確認しました。実験結果は、提案手法（AdaptLLM）が他の手法よりも優れた性能を示し、特に生物医学と法律の分野で顕著な向上が見られました。

Improving Domain Adaptation through Extended-Text Reading Comprehension

この研究は、長文読解を通じてドメイン適応の性能を向上させる方法を提案し、LLMによる質問応答生成と文書の長さに基づくクラスタリングを組み合わせることで、バイオメディカル分野で6.8%、金融分野で5.6%の性能向上を達成しました。LoRAを用いた微調整により、全パラメータ調整と同等の性能が得られ、クラスタリングの有効性も確認されました。

My Answer is C: First-Token Probabilities Do Not Match Text Answers in Instruction-Tuned Language Models

AI要約

背景

実験設定

使用したデータセット

Prompt形式

評価に使用したモデル

出力されたTextの評価

Results

Mismatch

Example templateがmismatchが高くなる理由について

Reject動作について

Text出力の方がFirst token probabilityより一貫性が高い

Conclusion

感想

Read Next