Improving Domain Adaptation through Extended-Text Reading Comprehension

この記事に関するIssueをGithubで作成する

My Answer is C: First-Token Probabilities Do Not Match Text Answers in Instruction-Tuned Language Models

多肢選択問題におけるLLMの評価で、First token probabilityと実際のテキスト出力の間にミスマッチがあることが示され、実際の出力を評価することが必要であると結論付けられました。特に小さいモデルではミスマッチが顕著で、プロンプト形式やモデルサイズが結果に影響を与えることが確認されました。

LLMBenchmarkarxiv

paper-stream2024-09-20

Adapting Large Language Models to Domains via Reading Comprehension

この論文では、ドメイン特化の生データを読解テキストに変換する新しい手法を提案し、生物医学、経済、法律などの分野での能力向上と汎用的なプロンプト対応能力の獲得を確認しました。実験結果は、提案手法（AdaptLLM）が他の手法よりも優れた性能を示し、特に生物医学と法律の分野で顕著な向上が見られました。

LLMPre-trainarxivICLR

paper-stream2024-11-18

Personal transcriptome variation is poorly explained by current genomic deep learning models

nature genetics

paper-stream2024-11-17

Machine-guided design of cell-type-targeting cis-regulatory elements

この論文は、機械学習を用いて細胞型特異的なCis-reguratory elements（CREs）を設計し最適化する新しい方法を提案している。研究者らは、Massively Parallele Reporter assay（MPRA）データを使用してCNNベースのモデル「Malinois」を訓練し、このモデルを用いて細胞型特異的なCREsを予測した。さらに、配列最適化フレームワーク「CODA」を開発し、in vitroおよびin vivo実験でその有効性を実証した。

nature

Improving Domain Adaptation through Extended-Text Reading Comprehension

AI要約

背景

研究成果

Methods

LLM-based data preprocessing

Length based clustering

Datasets

Main results

感想

Read Next