学术报告:Using GWAS summary statistics for data mining and machine learning

发布者:潘春德发布时间:2017-12-26浏览次数:237


受中国矿业大学信息与控制工程学院和中国矿业大学生物信息研究所邀请,美国埃默里大学(Emory university)秦昭晖副教授将在我校举行学术报告。欢迎广大师生踊跃参加!

报告题目:Using GWAS summary statistics for data mining and machine learning

时    间:1229日上午900

地    点:文昌校区逸夫楼邵206

主办单位:中国矿业大学信息与控制工程学院;中国矿业大学生物信息研究所

报告人简介:秦昭晖博士现任美国埃默里大学(Emory University)生物统计与生物信息学副教授。1990-1994年在北京大学概率统计学系本科学习,2000年在密西根大学获得统计学博士学位。2000-2003年在哈佛大学刘军教授指导下从事博士后研究。2003-2010年在密西根大学生物统计系任助理教授,2010年转任现职。秦博士在生物信息学,计算生物学,基因组学及统计遗传学等领域有十四年的丰富研究经验。以首席科学家的身份主持过多项包括美国国家卫生院及国家科研基金项目。目前已发表一百多篇同行评议的研究论文,谷歌学术统计的论文总引用超过14千次。在生物信息学领域,尤其是在分析高通量全基因组数据及下一代DNA测序方面拥有丰富的经验。秦博士目前的主要研究兴趣在高通量组学数据分析,以及利用统计建模和机器学习等方法进行组学大数据的数据挖掘和分析。

报告摘要:Genome-wide association studies (GWASs) have successful identified many sequence variants that are significantly associated with common diseases and traits.Tens of thousands of such trait-associated SNPs have already been cataloged which we believe form a great resource for genomic research. Recent studies have demonstrated that the collection of trait-associated SNPs can be exploited to indicate whether a given genomic interval or intervals is likely to be functionally connected with certain phenotypes or diseases. Despite the importance, currently there is no ready-to-use computational tool that one can use to perform such task. Here we present traseR, an easy-to-use R Bioconductor package that performs enrichment analyses of trait-associated SNPs in arbitrary genomic interval(s). We further describe effort to combine GWAS data with genome-wide profiling data to annotate noncoding variants.