基于 DNABERT 编码的启动子预测模型
作者:
作者单位:

上海交通大学

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(82150610506)


A Promoter Prediction Model Based on DNABERT Encoding
Author:
Affiliation:

Shanghai Jiao Tong University

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    启动子是位于基因上游区域的特定 DNA 序列,通过识别和预测 DNA 序列中的启动子,可以更好地理解基因调控的机制,促进生物学和医学研究的进展。通过实验的方法来预测启动子既昂贵又费时,而通过计算方法进行启动子预测同样存在不足之处,如精度有待提升、序列编码方式所包含的信息量不足等。该文提出了一种新的编码方式,将预训练模型DNABERT 应用于启动子预测的编码,并测试了使用不同深度学习模型进行预测的效果。实验结果表明,使用经过预训练和微调的 DNABERT 进行编码的 Transformer 模型在启动子预测任务中取得了较好的效果。

    Abstract:

    Promoters are specific DNA sequences located in the upstream region of genes. By identifying and predicting promoters in DNA sequences, a better understanding of gene regulation mechanisms can be achieved, thereby advancing biological and medical research. Experimental methods for promoter prediction are both expensive and time-consuming. Additionally, computational methods for promoter prediction have limitations such as room for improvement in accuracy and insufficient information content in sequence encoding methods. This paper introduces a novel encoding approach that applies the pre-trained model DNABERT to promoter prediction. Different deep learning models are tested for prediction performance. Experimental results demonstrate that the Transformer model encoded using pre-trained and fine-tuned DNABERT achieves the best performance in promoter prediction tasks.

    参考文献
    相似文献
    引证文献
引用本文

李伟豪,刘喆,林关宁.基于 DNABERT 编码的启动子预测模型[J].生物医学工程学进展,2023,(4):364-370

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-11-08
  • 最后修改日期:2023-11-08
  • 录用日期:2023-11-21
  • 在线发布日期: 2024-01-13
  • 出版日期:
二维码