生信爱好者周刊(第 178 期):为何肿瘤空间分布至关重要¶
这里记录值得分享的生信相关内容,每半月发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
封面图¶

本周话题:Why tumour geography matters — and how to map it¶
探究肿瘤组织样本在分子尺度上的空间分布的技术正在推动癌症研究的革命,但是庞杂的技术让人感到困扰.
生信研究¶

随着基因组测序数据呈指数级增长,现有的计算发放在寻找相似的基因组序列上显得力不从心。为了解决这个问题,文章提出稀疏基因组学的概念,其通过排除基因组序列中的大量碱基,生成更短、更稀疏的序列,从而减少计算负载和内存占用。这种方法能够加速基因组分析,能在保持高准确性的前提下,显著减少存储空间的需求。 - 论文链接:https://doi.org/10.1038/s41467-024-55762-1
2、iMetaOmics | 同济/上海交大-开发支持群体分组分析的宏基因组测序综合分析软件

该软件是一个针对宏基因组鸟枪法测序的综合分析软件,同时包含了群体分组分析。它包括14个模块,拥有超过50个功能,与现有的17种宏基因组鸟枪法测序(whole-metagenome shotgun sequencing,WMGS)工具相比,因其全面性而脱颖而出。OUTPOST为多组实验设计和基于荟萃分析的生物标志物鉴定引入了创新方法。 - 论文链接:https://onlinelibrary.wiley.com/doi/abs/10.1002/imo2.29
3、Nature Genetics | 整合分析揭示三维基因组与DNA、RNA和表观遗传改变之间在转移性前列腺癌中的相互作用!

该研究通过深度 WGS、WGBS、RNA-seq等多种全基因组方法对 80 例 mCRPC 活检样本进行了分析,并揭示了癌症中常见的基因组、表观基因组和转录组改变与基因组三维拓扑结构之间的相互作用。 - 论文链接:https://doi.org/10.1038/s41588-024-01826-3

2025年1月22日发表在Nature Biotechnology杂志上的一项研究中,英矽智能与来自多伦多大学、圣裘德儿童研究医院等机构的科学家们将量子计算模型与经典计算模型和生成式人工智能相结合,通过对庞大数据集的训练、生成和筛选,探索更广泛的化学可能性,发现了靶向“不可成药”癌症驱动蛋白KRAS 的新颖分子。该研究首次展示了量子计算和人工智能在变革药物发现流程方面的潜力。 - 论文链接:https://www.nature.com/articles/s41587-024-02526-3
博文咨询¶
5、有偿论文“捉虫”:发现已发表论文中的错误可获得奖励 |《自然》职场

- 原文链接:https://www.nature.com/articles/d41586-024-02681-2
关于科学界的自我纠错能力,Malte Elson直言:”我们目前处理错误的方式是无效的。”ERROR项目是一个旨在系统性检测并纠正已发表心理学论文中错误的计划,通过向评审员支付报酬来检查高影响力论文的代码、统计分析和引用错误,并向提供数据和配合的作者提供补偿。项目优先选择高引用论文以扩大影响,并希望建立一种可推广的模式。目前面临作者参与度低、数据获取困难和寻找合格评审员等挑战,团队正寻求扩展至其他学科(如人工智能和医学),并呼吁研究资助机构为错误评审提供资源支持,认为系统性审查能提高科研经费的效益。

几乎所有人在数据分析中都关心一个问题,即样本量最低要多少。2020年发表在《PLOS ONE》的一篇题为《A solution to minimum sample size for regressions》的文章论述了在一般线性回归和meta 回归中,最低样本量应该是多少,模型结果就既能反映数据的实际格局,又具有较高的可重复性。
- 论文链接:https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0229345

BioSpace盘点了2024年销售额最高的10大医药产品。
- 原文链接:https://www.biospace.com/business/10-best-selling-drugs-of-2024-rake-in-billions-amid-exclusivity-threats
工具¶
Docker Image Puller 是一个方便的工具,用于从 Docker 仓库拉取镜像,支持国内镜像源加速和多架构支持。该工具采用 MIT 许可证,开放源代码,方便用户根据需要进行定制和扩展。

AigcPanel 是一个简单易用的一站式AI数字人系统,小白也可使用。 支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。

MedicalData是一个专为医学领域打造的数据练习题库,包含15个医学数据集,从几百年前的坏血病研究到最新的新冠检测数据,覆盖经典案例与现代临床试验。其核心目标是帮助医生、护士、药师、医学生等从业者,通过R语言实践可重复研究。
资源¶
11、硬核基础科研系列汇总
推文汇总了细胞与分子生物学,分子克隆,qPCR等基础的科研知识。
- 网站链接:https://www.cncb.ac.cn

国家生物信息中心 是我国生物信息领域的核心平台,致力于推动生物大数据的统一汇交、集中存储与安全共享,为科学研究和成果转化提供坚实支撑。
贡献者(GitHub ID)¶
「Openbiox 生信周刊」运维小队: - @ShixiangWang(王诗翔) - @kkjtmac(阚科佳) - @NiEntropy(赵启祥) - @He-Kai-fly(何凯) - @JnanZhang(张佳楠) - @Tomcxf(陈啸枫) - @wangdepin(王德品) - @kongjianyang(空间阳) - @donghongyu2020(董弘禹) - @DrRobinLuo(罗鹏) - @Wangcy-rachel(王春阳) - @zoe3251(舒晨阳) - @yanbin85 (严彬) - @MadDERt(王章宇)
订阅¶
这个周刊每周日发布,同步更新在微信公众号「生信协作组」(elegant-r)上。
微信搜索“生信协作组”或者扫描二维码,即可订阅。
(完)