生信爱好者周刊(第 46 期):你的苹果M系列芯片电脑跑生信顺利么?¶
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
封面图¶
本周话题:你的苹果M系列芯片电脑跑生信顺利么?¶
ARM平台的苹果M系列芯片自发布以来已经有2年了,更强劲的M2系列芯片也可能在10月份发布。目前生信软件在M系列芯片上的兼容性也日趋完善,想必有不少小伙伴已经入手尝试了,那么来分享一下你在使用苹果M系列芯片电脑跑生信的感想吧!
kkjtmac
- 最近入手了M1版本的Mac mini,尝试了R语言下的常规转录组下游分析,和Intel版本下的没有差异,而且基本没听到风扇转动。
生信研究¶
1、ActiveSVM | 提取scRNA-seq中的最小基因集
作者开发了一种特征选择方法ActiveSVM,通过带有支持向量机分类器的主动学习策略来处理顺序特征选择。从大型单细胞 mRNA-seq 数据集中提取高信息量的基因,构建用于细胞分类的最小基因集。该方法可以降低计算和测序成本,为主动采样策略提供依据。
- 论文链接:https://www.nature.com/articles/s43588-022-00263-8
- 教程:https://pypi.org/project/activeSVC/
空间转录组学和其他空间技术使科学家能够解剖肿瘤微环境中不同细胞类型的组织和相互作用。本文请专家讨论了该技术的一些方面,从揭示肿瘤微环境和异质性,到跟踪肿瘤进化,到指导肿瘤治疗,到目前的技术挑战。
- 论文链接:https://www.cell.com/cancer-cell/pdf/S1535-6108(22)00385-3.pdf
3、Cell | “千人基因组计划”资源扩展——高覆盖全基因组测序和改进的分析方法发现更多基因变异
近日,来自纽约基因组中心的研究人员与麻省总医院、耶鲁大学和人类基因组结构变异联盟(HGSVC)的合作研究在Cell上发表,其扩展了1kGP资源,分享了一个包含3202个样本高覆盖率WGS资源,包括602个完整的亲子三人组。研究团队通过机器学习模型集成了多种分析方法,进行了SNV和INDEL的鉴定,并生成了一组全面的SV数据集。研究团队还与前期数据集进行了比较,强调了此次变体鉴定方法的高灵敏度和高精度,特别是对罕见SNV、INDEL和不同频率SV的检测,这些都是以前低覆盖率测序无法实现的。
- 论文链接:https://www.cell.com/cell/fulltext/S0092-8674(22)00991-6?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS0092867422009916%3Fshowall%3Dtrue
博文资讯¶
4、四十年编程感想
本文作者8岁学习编程,今年46岁,写了一大堆自己的感想,其核心要点如下:
- 编程是长期职业:你的目标不必局限在学习什么语言或框架,只要吃透基础知识,你可以学会任何你想要的东西。
- 多尝试不同的事情:1)刚开始不要急于求成;2)需要学习很多不同的东西,你按什么顺序学习它们并不是大问题;3)多学习一些困难的东西,容易发现自己的问题;4)最终需要深入某个领域
- 目标是变得更好:不管使用什么技术,你的目标都应该是动手做出成果,让自己变得更好。
- 继续工作:编程既不是短跑,也不是马拉松,而是日记。在日复一日的累积当中,完成你的事业。
该推文列举了生物序列比较的主要应用场景: - 物种/基因的进化 - 基因组学 - 不同功能的进化特征 - 引物设计 - 参考基因组比对
本文根据时间顺序整理归纳了癌症靶向治疗及其相关研究领域中的里程碑事件。
本文简述了在论文投稿前需要检查的25个细节,为文章的顺利接受提供有力的投稿准备!
工具¶
ggmsa是Y叔团队开发的进行多序列比较结果可视化的R包,相关成果也发表在Briefings in bioinformatics上。
- 链接:https://github.com/YuLab-SMU/ggmsa
ggpie利用ggplot2实现了饼图(2D和3D)、甜甜圈饼图和玫瑰饼图的绘制。
- 链接:https://github.com/showteeth/ggpie
R-grafify包,其包含了5大类共19种可视化图表,帮助大家更便捷的绘制符合出版要求的可视化图表。5个类别分别为:Two variables、Three or four variables、Numeric X-Y Plots、Before-after Plots、Data distributions。
- 链接:https://github.com/ashenoy-cmbi/grafify
该插件将 R 语言的调试功能添加到 Visual Studio Code,依赖于R 包 vscDebugger 。
- 链接:https://github.com/ManuelHentschel/VSCode-R-Debugger
资源¶
宾夕法尼亚大学的一门生物信息学自学课程,涉及 rna-seq 分析和单细胞转录组分析。网站包括课程 slides、video、以及其他一些免费资源。
- 资源链接:https://diytranscriptomics.com/project/lecture-intro
13、design-resources-for-developers | 开发者的设计资源集合
该集合整合了设计各方面的资源,项目包含了图片、网站模版、CSS 框架、UI 等资源。
- 资源链接:https://github.com/bradtraversy/design-resources-for-developers
该笔记详细的scATAC-seq学习笔记汇总,从原始数据上游处理,数据整合,细胞分群,motif富集分析,轨迹分析等。
历史上的本周¶
贡献者(GitHub ID)¶
「Openbiox 生信周刊」运维小队:
@ShixiangWang
@kkjtmac
@NiEntropy
@He-Kai-fly
@JnanZhang
@Tomcxf
@wangdepin
订阅¶
这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。
微信搜索“优雅R”或者扫描二维码,即可订阅。
(完)