生信爱好者周刊(第 57 期):深度学习并非“简单的统计”,二者距离已越来越远¶
这里记录每周值得分享的生信相关内容,周日发布。
本杂志开源(GitHub: openbiox/weekly),欢迎提交 issue,投稿或推荐生信相关内容。
封面图¶
本周话题:深度学习并非“简单的统计”,二者距离已越来越远¶
统计学习在深度学习中扮演着重要的角色,这是毋庸置疑的。但可以肯定的是,统计角度无法为理解深度学习提供完整的画面,要理解深度学习的不同方面,仍需要人们从不同的角度出发来实现
@He-Kai-fly - 深度学习就是用统计学从数据中找到隐藏规律,并且都是建立在大量数学运算的情况下,其中一部分都建立在统计学的基础上但又不完全是。
生信研究¶
1、Nature Communication | 单细胞环形RNA分析技术及表达图谱
赵方庆团队基于海量单细胞全长转录组测序数据集,实现了单细胞分辨率下环形RNA的高效识别及深度挖掘,基于大规模时空组学数据的整合分析,对环形RNA的细胞异质性进行了深入探究,揭示了环形RNA作为细胞类型标志物的应用潜力。该研究将目前环形RNA研究从传统组织水平提升至单细胞水平,为探索不同细胞类型中环形RNA的生物学功能提供了重要的数据资源和分析技术。
- 数据库地址:http://circatlas.biols.ac.cn/
- 论文链接:https://www.nature.com/articles/s41467-022-30963-8
2、iMeta | 南农沈其荣团队发布微生物网络分析和可视化R包ggClusterNet
网络分析逐渐被生态学家们重视并持续应用于生态学领域,开发更为强大和方便的网络分析工具十分必要。文章开发了名为ggClusterNet的R包,展示微生物网络模块化信息,用于更加容易的进行网络数据分析挖掘和可视化。在ggClusterNet包中设计了数十种网络布局算法用于更好的展示微生物网络模块化信息
- Paper地址:https://onlinelibrary.wiley.com/doi/10.1002/imt2.32
- Bilibili: https://www.bilibili.com/video/BV1ig411Q7cw/
- Youtube:https://youtu.be/XQ4xhCo_p0s
- Github: https://github.com/taowenmicro/ggClusterNet/
3、 Sci Adv | 岳峰团队开发深度学习模型EagleC 捕捉癌症基因组结构变异
该项工作基于深度学习和集成学习策略,提出一个全新的捕捉癌症基因组中SV的计算框架EagleC。EagleC能够用于多种染色质构象捕获技术,比如Hi-C,Micro-C,HiChIP。更为重要的是,这个深度学习的模型可以直接用在单细胞Hi-C上,从而可以监测到癌症组织里的不同癌细胞结构变异的异质性。
- 论文链接:https://www.science.org/doi/epdf/10.1126/sciadv.abn9215
4、NBT| 高歌课题组单细胞多组学数据整合与调控推断新方法(GLUE)
基于图耦联策略的深度学习方法GLUE,实现了对百万级单细胞多组学数据的无监督精准整合与调控推断
- 论文链接:https://www.nature.com/articles/s41587-022-01284-4
博文资讯¶
以一个例子介绍了如何使用神经网络来处理简单问题(数据量较小的回归问题),但在实际过程中还会遇到很多问题,相关资源可见:基于 R 语言的深度学习——简介及资料分享
Makefile 是一个常见的配置驱动的构建系统。这篇文章介绍 Taskfile:
Taskfile 通过 yaml 来描述各种执行任务, 其核心采用 go 编写; 相较于 Makefile 的 tab 分割和 bash 结合语法 Taskfile 显得更加现代化和易于使用(虽然会变成 yaml 工程师). Taskfile 内置了动态变量、操作系统等环境变量识别等高级功能都更贴合现代化的 Coding 方式。 - 文档:https://taskfile.dev/
本文演示了利用circlizeR包绘制环形热图,并添加文字标签
工具¶
8、staticmiports静态导入函数到R包中
staticimports可以很容易地将函数静态地导入到R项目或包中。静态导入意味着函数作为文本复制到项目中,而不是在运行时从单独的包中加载。
- Github:https://github.com/wch/staticimports
9、Fluent Reader | 一款新颖的桌面RSS阅读器
Fluent Reader是一款支持windows和mac平台的RSS阅读器。
很多人可能不知道 R 也可以写 GUI 的,虽然说不能脱离 R 环境独立运行。
{eventloop}
包提供了一个框架,用于呈现交互式图形,并以足够快的速度处理用户的鼠标+键盘事件,以满足游戏和其他实时应用程序的需求。
11、tkinter-helper - 一款为Tkinter打造的布局助手
TkinterHelper(Tkinter布局助手)是一款为Tkinter打造,仅需拖拽组件进行布局,所见即所得,非常方便就能做出一个GUI界面,再配合 pyinstaller 库将程序打包成exe,简直是开发小工具的利器。
- Github: https://github.com/iamxcd/tkinter-helper
- Gitee: https://gitee.com/iamxcd/tkinter-helper
方便用于宏基因组分箱(binning)后的单菌基因组fasta或faa文件的KEGG注释,挖掘线索支持后续验证
资源¶
一个完全在浏览器中运行轻量级版本的VS Code。可在本地机器上打开一个文件夹并直接开始编码。
- 地址:https://vscode.dev
14、 TIP : Tracking Tumor Immunophenotype
TIP是一个用户友好的一站式网络工具,用于使用RNA-seq或微阵列数据跟踪、分析和可视化抗癌免疫状态和肿瘤浸润免疫细胞在七步癌症免疫周期中的比例。
- TIP 平台 : http://biocc.hrbmu.edu.cn/TIP/
- github : https://github.com/dengchunyu/TIP
历史上的本周¶
- 2022年1月:第 17 期:Cox比例风险模型著作者离世
贡献者(GitHub ID)¶
「Openbiox 生信周刊」运维小队:
@ShixiangWang
(王诗翔)@kkjtmac
(阚科佳)@NiEntropy
(赵启祥)@He-Kai-fly
(何凯)@JnanZhang
(张佳楠)@Tomcxf
(陈啸枫)@wangdepin
(王德品)
订阅¶
这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。
微信搜索“优雅R”或者扫描二维码,即可订阅。
(完)