Personal transcriptome variation is poorly explained by current genomic deep learning models

この記事に関するIssueをGithubで作成する

Adapting Large Language Models to Domains via Reading Comprehension

この論文では、ドメイン特化の生データを読解テキストに変換する新しい手法を提案し、生物医学、経済、法律などの分野での能力向上と汎用的なプロンプト対応能力の獲得を確認しました。実験結果は、提案手法（AdaptLLM）が他の手法よりも優れた性能を示し、特に生物医学と法律の分野で顕著な向上が見られました。

Machine-guided design of cell-type-targeting cis-regulatory elements

この論文は、機械学習を用いて細胞型特異的なCis-reguratory elements（CREs）を設計し最適化する新しい方法を提案している。研究者らは、Massively Parallele Reporter assay（MPRA）データを使用してCNNベースのモデル「Malinois」を訓練し、このモデルを用いて細胞型特異的なCREsを予測した。さらに、配列最適化フレームワーク「CODA」を開発し、in vitroおよびin vivo実験でその有効性を実証した。

Improving Domain Adaptation through Extended-Text Reading Comprehension

この研究は、長文読解を通じてドメイン適応の性能を向上させる方法を提案し、LLMによる質問応答生成と文書の長さに基づくクラスタリングを組み合わせることで、バイオメディカル分野で6.8%、金融分野で5.6%の性能向上を達成しました。LoRAを用いた微調整により、全パラメータ調整と同等の性能が得られ、クラスタリングの有効性も確認されました。

My Answer is C: First-Token Probabilities Do Not Match Text Answers in Instruction-Tuned Language Models

多肢選択問題におけるLLMの評価で、First token probabilityと実際のテキスト出力の間にミスマッチがあることが示され、実際の出力を評価することが必要であると結論付けられました。特に小さいモデルではミスマッチが顕著で、プロンプト形式やモデルサイズが結果に影響を与えることが確認されました。

Personal transcriptome variation is poorly explained by current genomic deep learning models

この論文でやっていること

使用されているモデル

その他

Conclusion

Read Next