无实验无数据没关系,挖掘别人的数据,发表自己的文章
两天一夜高强度实训,讲究实战,所有经验和盘托出
会后赠讲课录像便于反复复习保障效果(加密播放不零售,保障学员优势权利)
2021/9/11-12 网络精讲班(会议时间两天&一晚)
莫速乎科研会议平台主办
还在认为没有实验就不能发表论文?还在为不精通挖掘GEO,TCGA,SEER的数据库而痛苦不堪?还在为不知道如何找课题找靶点而苦恼?还在为不会那些高大上的图表而暗自伤神?快来参加莫速乎的科研数据挖掘实战专题学习班吧,挖掘别人的数据,发表自己的文章,一次学习,不再报班!
本会议由于带着明确的目的性去学习R语言,且针对有/无R语言基础的学员均具有很大宽容性,自开班起就广受好评。随着近年来生物信息学技术的普及,R语言是每个科研工作者都有必要掌握的技能,以往漫无目的的学习R效果不理想,用R去进行科研数据挖掘,既学习了R又解决了实际科研问题。
学完课程并掌握后能干什么:
学完课程并掌握后能收获什么技能?
1.没有课题的时候找到课题,没有机制的时候挖掘机制。
2.为基金申请保驾护航,发表paper如虎添翼
3.掌握R语言的核心技能,掌握批量分析数据的能力,掌握自我迭代的思维体系
4.掌握表达谱芯片数据,RNAseq转录组数据,甲基化芯片数据,GEO数据库和TCGA数据库等数据的处理
5.科研绘图:常见科研需求自我满足不求人,特殊需求实现自己定制高端大气。
这是一份带有诚意且注重实战的数据挖掘课程。我们的目标是:一次学习,不再报班。
课程特点
课程特点:
1.不留秘密,私货全出,全程只用R语言,关键步骤不隐藏。
2.第一天晚上时间充分利用,增加带有讲师指导的练习,更多的训练时间,更好的掌握。
3.讲最核心的知识,讲通用的数据挖掘技能,适合各个专业。学后可应用到其他数据库的挖掘。
4.空谈误国,实例操作(至少4个套路),让你快速掌握数据挖掘套路。
5.课程中使用卡片记忆法,帮助学员迅速牢靠地记住R语言知识点。
6.讲师阵容强大,内容丰富深入, 课程设计循序渐进,渐入佳境。
涉及议题:
1.如何使用生物信息学,在没有课题的时候如何找课题,在没有机制的找机制?
2.科研中细胞系处理的两大刚需,加药以及基因敲减,有什么好的分析方案可以让我们精准定位到下游核心分子?
3.为什么大部分公司给的分析结果都用不了啊,导师和我都很着急,怎么处理才能够变废为宝?
4.GEO表达谱芯片数据如何挖掘分析,才能避免画个热图火山图,聚类图就草草了事?
5.TCGA数据库中的数据,如何从下载到分析,到变成可以任意基因任意癌症轻松出图的清洁数据?
6.生存分析的多种方案,包含一个基因的生存分析,两个基因的生存分析,一群基因的生存分析,8秒完成2万个基因的批量相关性分析。
7.如何学会编程的看家本领,让重复的工作批量执行(批量分析,批量作图,批量处理文件)?
8.构建临床预后模型的完整方案是什么?
9.课题组比较关心免疫浸润分析,目前有哪些方案可以提供?
10.我入门的有点晚了,数据都被别人挖完了,有什么开挂的解决方案?
11.为什么做KEGG富集分析的时候,肝癌的数据会聚类出系统性红斑狼疮通路,我该怎么解释?
12.给你一个基因,在不做实验的情况下,你对他能了解到什么程度,以及能产生多少可放在文章中的数据?
13.给你两个基因,在不做实验的情况下,你对他们之间的关系能了解到什么程度,以及能产生多少可放在文章中的数据?
14.给你一群基因,在不做实验的情况下,你对他们能了解到什么程度,以及能产生多少可放在文章中的数据?
15.我做基础研究的,老板不需要纯生信的文章,数据挖掘怎么才能得体的用到自己课题上面来啊?
16.差异分析是数据挖掘的灵魂,那么小样本,大样本,配对样本,多分组样本的差异分析怎么做?
17.GSEA分析是富集分析的神器,他好在哪里,如何使用?如何用GSEA给自己的课题提速?
18.ceRNA如何分析,分析的前提是要掌握mRNA,lncRNA,miRNA的分析
19.目前的signature文章中有哪些埋好的雷等着你去踩?
20.那么多的GEO平台,如何以不变应万变地进行探针ID转换?
21.GEO多芯片数据如何批次矫正?
22.为什么ssGSEA算法是批次效应的终结者?
23.如何使用Guilt of association 方案注释手上的长链非编码RNA?
24.单基因GSEA的用途在哪里?为什么出来的结果跟我想要的不一样?
25.我手上的样本有点多,WGCNA怎么做?
26.如何才能提取出转移和非转移配对的TCGA样本出来进行下一步分析?
27.我想进一步学习,但不想到处折腾了,有哪些你珍藏的资源推荐?
28.你是通过什么途径学会自己想要的技能的?有什么固定的流程么?
。。。
课程设计:
这么多的内容显然是无法在两天1晚的课程中讲完,否则都是浮光掠影,空有其表。
因此,我们根据科研人学习的四个层面,把课程分成了四个部分。
第1,学会手把手教学的技能:
这部分内容就是课程的主体, 两天1晚的直播课程,配合动画,记忆卡片,大量实操循序渐进让学员迅速入门
其中记忆卡片的使用,有效解决了"讲师口里一大堆,学员脑子一片白"的尴尬局面,这种情况会让学员迅速失去兴趣。
经过测试,即使是零基础的学员也能在第1天结束后记住所教的R语言知识点。
第2,看视频学会技能:
该部分内容是附加课程,需要课后打卡自学,目的是让学员多操多练,渐入佳境。
这部分技能比较硬核,不适合在课堂上讲解,需要学员在掌握基础技能的时候再慢慢深入。
避免出现"脑子会了,手说不会"等手脑不协调的窘境。
第3,看文字学会技能:
我们在课程的文档中穿插了100个文字教程,解决一些小而精巧的问题.
这部分技能训练的是学员自学的能力,有利于让学员形成自我迭代的能力。
在数据挖掘的过程中,并不是每一个技能都能找到合适的教程。
生信工作者长期在做的事情就是阅读文档。
第4,学会没有人教的技:
课程结束后布置涉及到高频操作的家庭作业,作为对课程的巩固和升华,需要学员在一月内提交然后讲师团队评阅。
这部分习题没有标准答案,类似于开放课题,要求学员通过自我学习,互相合作来完成。
学会没人教的技能,是数据挖掘的常态,你不能老是重复别人的套路,因为"既是套路,就为俗物,终将废物"。
我们希望将来在你思路到了的时候,要有能力从源头用代码来实现,而不是碰到了报错完全懵圈,不知进退。
这是数据挖掘的终极技能。
主讲人简介:
果子老师(果子学生信作者,在站博士后),在生信方面具有丰富经验,本次进行两天一晚的高强度实操训练,目标是让大家一次学习不再报班。
作为临床科研工作者,深知无课题之苦,因此愿将所学知识和盘托出,没有隐藏。
致力于给非生信专业人员普及生物信息学,擅长各种组学的处理,且讲课诙谐幽默。
适合人群:
广大临床/科研工作者及心有热血被困囚笼的研究生
查看更多
课程安排:
日期 |
时间 |
内容安排 |
|
第一天 |
08:30-11:55 |
R语言基础知识介绍 R语言中数据框的操作(增删改查) R语言读入以及写出数据 |
|
11:55-13:30 |
休息 |
||
13:30-17:00 |
使用卡片复习R语言基础姿势(两天中重复4次) GEO数据库成套流程实战(数据清洗,热图,火山图,GO分析,KEGG分析,共表达分析) GEO数据便捷实用的GSEA分析 GEO芯片的探针probe转化方法汇总 多个Geo芯片联合分析 |
||
17:00-18:00 |
休息 |
||
晚上 |
18:00-21:00 |
R语言数据框的操作练习(掌握tidyr和dplyr) TCGA原始数据的下载(GDC方法和R包方法) 任意癌症任意基因在癌和癌旁的表达 如果有亚型,在不同亚型中的表达 如果有肿瘤有分期,在不同临床分期中的表达 单个基因在多个正常组织中的表达 单个基因在多个细胞系中的表达 单个基因在多个肿瘤中的表达 两个基因的相关性如何分析 |
|
第二天 |
08:30-11:55 |
差异分析(从counts数据开始整理表达数据,表达矩阵归一化,DESeq2) 提取IncRNA矩阵 提取MiRNA矩阵 CeRNA网络构建 单基因的GSEA分析 神技能:注释任何一个基因包括长链非编码RNA |
|
使用多种统计算法定位 signatures cox,lasso回归 |
|||
生存分析 |
|||
TCGA文章的框架分析以及复现 |
|||
答疑环节 |
|||
11:55-13:30 |
休息 |
||
13:30-17:00 |
利用GEO和TCGA数据库找到课题 如何利用GEO和TCGA数据库申请基金 在R语言中清洗和整理数据达到对应R包的要求 数据处理过程中调整分析策略 |
||
查看更多
时间地点:
2021/9/11-12 网络精讲班(会议时间两天&一晚)
注册费用:
3400元/人 注册费包含网络直播平台费、专家讲课费及视频课程的费用。
主办单位:莫速乎教育(上海莫速乎教育投资有限公司)、上海荆麦信息科技中心
参会要求:
1、请自备笔记本电脑WINDOWS系统或mac系统均可。
2、所用软件会前三天微信发软件及安装教程,请自行下载安装。
3、会议期间寄送经盖章的纸质邀请函、发票供报销使用。
查看更多
找会议,上活动家(https://www.huodongjia.com/)!活动家是亚洲的会议活动、培训认证、商务游学考察,查询、报名、票务营销平台,致力于为用户提供有价值、有意义的商务会议活动,以及为主办方提供会议免费发布、活动推广营销,视频直播,在线选座等服务,是你参会、办会的好助手。