2023(4):325-330. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 001
摘要:在数字生物学实验室(DBL)20 年的发展历程中,我们见证了生物信息学与计算生物学的迅猛进步,并见证了实验室在科研成果、人才培养和科研合作等方面的显著成长。DBL 展现了在识别新机遇和拓展新领域方面的强大适应力,开发了许多创新的算法、软件和信息系统,为解决多种生物学和医学问题提供了有效的工具,还在数据分析和建模方面做了大量工作。在这个重要的 20 年里程碑时刻,我们回望过去所取得的成就,并以此为基础,满怀期待地展望未来,庆祝我们团队的共同努力和不懈追求。
2023(4):331-337. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 002
摘要:成果导向教育(OBE)是以学生的学习效果为中心来制订专业的培养计划,进行教学管理和教学资源配置的人才培养理念。该文以上海交通大学生物医学工程专业的专业基础课“生物医学工程研究的伦理及学术道德”为例,从教师视角解析如何按照 OBE 理念设置一门课程的学习目标,实现对毕业要求的支撑,并实现对课程目标全方位的评价和持续改进。通过案例分析,可帮助课程教师理解 OBE 理念,建设符合 OBE 理念和工程教育认证要求的课程。
2023(4):338-346. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 003
摘要:该文基于测序技术和人类基因组计划的不断发展,对医学工作者和生物信息工作者在肺腺癌领域取得的成果进行归纳分析,阐述了肺腺癌标志物的研究进展等。该文首先介绍了传统通过血清检测的肺腺癌标志物的研究进展,梳理了传统标志物从单一检测到联合检测的发展过程。其次介绍了在精准医学背景下,以多组学数据为依据的肺腺癌肿瘤标志物的研究进展。最后对该领域后期工作提出了展望,有利于研究人员准确掌握发展动态,开阔研究思路。
马偲臆 , 刘晓薇 , 谢雪琴 , 邓科君 , 鄢丹 , 林昊
2023(4):347-356. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 004
摘要:生物医学领域经常涉及多种数据类型,如图像、时间序列、各种组学分子数据等,通常存在样本稀缺和异质性的问题。如何充分利用有限的数据,同时解决数据的异质性问题,是生物医学领域面临的重要问题。迁移学习在生物医学领域的应用正在迅速推进。该方法可以缩小源域和目标域的差异,通过学习源域中已有的知识并提取两域的共享因子,将预测任务从源域迁移至目标域中。根据源域、目标域和两域任务的不同,迁移学习具有 3 种不同的应用场景。该文对迁移学习在生物医学领域的应用进行了分析,并结合 3 种场景下的不同应用实例进行对比,以探索迁移学习在该领域的现状和发展前景。
张黎 , 田若婷 , 王子文 , 王陈偲 , 朱德旭 , 王晗
2023(4):357-363. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 005
摘要:衰老是生物体多个器官、组织和细胞功能下降的一个过程,与衰老相关的疾病会在衰老过程中逐渐出现,同时伴随着表观遗传学机制的变化。相关领域的研究也表明,表观遗传学机制的变化过程与生物学年龄的增长密切相关。随着全球老龄化现象的加剧,抗衰老逐渐成为一个备受关注的研究方向,然而衰老过程的表观遗传学表征、机理和定量分析方式仍然需要深入研究。该文对当前基于 DNA 甲基化的衰老与年龄预测的领域研究进展进行梳理,介绍表观遗传时钟、生物时钟和 DNA 甲基化的基本原理,以及相应表观遗传时钟的典型研究方法和有效样本资源,并深入讨论该领域研究存在的挑战及发展趋势,旨在为研究者提供全面的参考,促进抗衰老相关临床实践和大健康应用的发展。
2023(4):364-370. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 006
摘要:启动子是位于基因上游区域的特定 DNA 序列,通过识别和预测 DNA 序列中的启动子,可以更好地理解基因调控的机制,促进生物学和医学研究的进展。通过实验的方法来预测启动子既昂贵又费时,而通过计算方法进行启动子预测同样存在不足之处,如精度有待提升、序列编码方式所包含的信息量不足等。该文提出了一种新的编码方式,将预训练模型DNABERT 应用于启动子预测的编码,并测试了使用不同深度学习模型进行预测的效果。实验结果表明,使用经过预训练和微调的 DNABERT 进行编码的 Transformer 模型在启动子预测任务中取得了较好的效果。
2023(4):371-380. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 007
摘要:准确的药物靶点亲和力预测(DTA)能够缩短药物研发周期,节省人力和物力,加速药物研发过程。图神经网络(GNN)在药物靶点亲和力预测中得到了广泛应用,但现有的方法大多基于浅层 GNN。该文提出了一种基于残差结构的图卷积网络,残差结构的加入能够加深网络结构,借此构建一个具有 24 个图卷积层的深度图卷积网络,以此捕获药物分子的特征,学习有效的嵌入表达,并在两个基准药物靶点亲和力数据集上与几种先进的基于机器学习或深度学习的模型进行比较。结果表明,该文所提模型相较于其他基准模型有着更好的预测性能,验证了该文所提方法的有效性。
2023(4):381-390. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 008
摘要:错义突变的致病性预测在基因组学和临床研究中有重要作用,其中基于计算方法的预测工具已经取得较大进展。现有的工具大多根据功能影响、保守性来对错义突变的致病性进行预测,从 DNA 序列出发进行错义突变致病性预测的工具较少。随着自然语言处理技术在多个生物序列领域的迁移学习和应用,将 DNA 序列作为一种生物语言进行处理并进行基因突变的致病性预测越来越值得探索。该文提出了一个基于预训练的自然语言模型 DNABert 和 DNA 突变序列对错义突变致病性进行预测的深度学习模型MissenseBert,并且在多个数据集上对MissenseBert进行了训练和测试,测试结果说明MissenseBert取得了较好的预测效果,证明了利用 DNA 序列预测错义突变的致病性具有可行性。
2023(4):391-397. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 009
摘要:以往基于时域和频域的图卷积网络模型在三维人体运动预测上显示出令人印象深刻的结果。然而,时域和频域是同一个人体动作信号在不同域的表现,该文同时结合人体位姿在时域和频域的序列进行编码,并在两个通道上对不同表现形式的关节信息通过注意力机制强化人体骨骼各节点之间的相互依赖关系。最后通过基于图的门控循环单元(G-GRU)对编码信息进行递归解码,输出预测的运动序列。该文在 Human 3.6M 和 CMU-MoCap 数据集上测试了所提的模型,实验证明,该文所提的模型能获得比以往模型更准确的预测结果。
2023(4):398-404. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 010
摘要:文本分类作为自然语言处理领域的核心内容,已经成为文本处理的重点研究问题。该文主要针对社会上出现的大规模常见疾病进行预测。该文通过获取全球各大新闻媒体报道的新闻文本,分别统计新闻文本中出现次数排名前十的疾病,分析原始数据分布的特征。该文将基于 CNN 和 LSTM 网络的文本模型与基于 LSTM 网络的疾病趋势模型进行融合,综合分析文本中新闻文本的文本信息和疾病的时间序列,并使用了一种特殊的疾病选择策略。实验结果表明,该策略在 7 种不同的新闻数据集上获得了 70%以上的准确度。该文提出的融合策略和疾病选择策略对疾病的趋势预测具有一定的意义,有助于提高疾病趋势预测的准确性。
2023(4):405-411. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 011
摘要:目标物体计数是计算机视觉领域的重要研究方向。针对小样本计数中存在的样本与查询图像目标物体尺寸不一致、目标物体分布不均匀的问题,该文提出了多尺度特征增强计数算法。首先,基于特征金字塔构建自上而下的特征融合网络。在各级尺度上对查询图像中和样本相似度较高的区域进行样本特征增强,随后送入上一级特征匹配。然后,将各级增强后的查询特征送入回归器中,得到各级密度图。最后,求和,生成高质量的密度图。该文在 FSC-147 和 CARPK 数据集上进行测试。实验结果表明,该文所提模型的性能优于大多数其他方法,有效改善了目标物体大小变化造成的计数精度低的问题。
2023(4):412-416. DOI: 10. 3969 / j. issn. 1674 - 1242. 2023. 04. 012
摘要:目的 鉴定焦虑障碍的风险基因。方法 基于因果基因集精细映射法,整合来自英国生物银行关于焦虑障碍疾病的全基因组关联研究数据与来自大样本人脑表达数量性状转座子数据来寻找和焦虑障碍相关的风险基因。结果和结论 该研究筛选出了 FAM167A、MSRA、TDH 等 12 个基因作为潜在的可能导致焦虑障碍的风险基因,证明了它们与焦虑障碍疾病的相关性,也为后续开发焦虑障碍的临床诊疗靶点提供了可能的方向。
技术支持:北京勤云科技发展有限公司