2024年5月18日,2022级生物信息学班全体学生参加了“河南大学——北京百奥华兴基因科技有限公司实习实践教学基地揭牌仪式”,会议由教务办张要军老师主持,出席会议的领导老师有河南大学生命科学学院副院长赵海鹏老师、生物信息学专业负责人苗原老师、本次实习负责人石艳云老师、班主任高凯老师、高巍等老师以及实习公司的相关领导。
本次会议由实习公司对公司基本情况、具体实习内容做了详细介绍,同学们也提出相关问题加深对本次实习的了解。百奥华兴创立于2023年,以基因大数据智算软件与智能平台为核心,专注人类疾病的精准诊断及生物育种研究。凭借强大的科研能力、自有平台和数据资源,研发智算加速软件和一站式育种平台,致力于开发实破性的疾病诊断软件和颠覆性的育种技术。该企业员工大都拥有近十年的基因检测项目经验,我们进入公司可以学习到药物研发、生物育种大数据平台开发、科技服务产品等多样内容。最后,赵院长再次强调了我们本次实习的特殊性与重要意义。至此,我们对实习有了初步了解。
2024年5月23日,我们又参加了“河南大学——北京百迈客生物科技有限公司实习实践教学基地揭牌仪式”。张要军老师主持会议,研究生与科研办公室主任朱显峰、副院长赵海鹏、实习负责人石艳云老师以及缪建顺等实习公司相关领导参与并做出重要指导。
经过本次会议,我们对百迈客这个公司的企业文化,公司总体建设有了深刻的了解。百迈客相对于百奥华兴创立时间较早,公司结构较为完善,现已为全球提供基因多组学测序服务和单细胞空间组学仪器设备的国家级高新技术企业。为海内外科研高校、研究所等提供标准化、个性化、整合化的全方位技术服务和产品解决方技服务、智能制造二大业务板块。该公司长期致力于基因组学和生物信息学的技术开发和科学探索,为生物科研、生物医药、生物农业、生物能源等领域提供基因技术支持和服务。在随后的交流环节也有部分同学表示,希望以后可以有更多的机会到贵公司实习。
7月1日,实习出发前夕,我们召开了实习动员大会。副院长赵海鹏、辅导员李靖宇以及实习带队老师石艳云、孙杨、吴忠霞、高巍等出席并对本次实习的纪律安全等问题做出要求。
李老师特别向我们强调,实习应以安全第一,不可私自与实习公司人员进行接触,不可夜不归宿,要求各组长切实负起责任,保证实习顺利进行。同时李老师以身边人举例向我们说明,实习经历有助于我们正确认识本专业的就业方向与就业目标,对个人发展具有举足轻重的作用。赵院长也表明实习应动手动脑,切不可应付了事,对实习安排漠不关心。生物信息学专业是顺应社会发展而设立,作为第一届学生,应具有模范带头作用,学生应顺应国家发展方向,努力为国家做出一定贡献,以实现自身价值。
7月4日上午我们正式出发到住宿地。在此之前我们已经完成分组,宿舍分配,服装准备等各项工作,在出行过程中各组长认真负责时刻注意组内成员动向,互相帮助互相配合。
我们提前一天约定集合地点和时间,提醒大家携带身份证。7月4日上午11点,各组成员集合拍照,并于到站后一同组织乘坐地铁到达宾馆。下午石老师到公司进行实地考察,并组织各组长开会,重申实习内容安排。
本次实习内容丰富项目较多强度较大,提醒同学们多多提问多多思考尽可能多的了解公司与学校基础知识学习的不同,项目设计过程中侧重点。每一个项目产品都是经过公司调研部、研发部、宣传部等多部门协作,多次修改凝结而成,同学们万不可轻视。
2024年7月5日,河南大学生命科学学院2022级生物信息学本科生的暑期实习之旅在武汉市北京百迈客生物科技有限公司武汉分部正式开启。这天早上,我们在石艳云老师的带领和北京百迈克公司员工的合作下,启程前往公司,参与了一次内容丰富、干货满满的实习培训。
7月5日上午九点钟,培训正式开始,我们首先被引入了转录调控及医学基因组和基因组学产品的基础知识。公司人员以深入浅出的方式,向我们介绍了多组学调控机制、表观遗传学等知识背景。他们详细讲解了WES(全外显子测序)、WGS(全基因组测序)、三代长读长全基因组重测序等技术,让我们对这些技术的原理和应用有了初步的了解。
其中,转录组组学技术方法的介绍尤为精彩,PB全长转录组、ONT全长转录组、ATGC-seq等技术的应用场景和优势被一一阐述,让我们对生物信息学在实际研究中的应用有了更加深刻的认识。Hi-C互作技术和WGBS(全基因组亚硫酸盐测序)的讲解,更是让我们对基因组三维结构和DNA甲基化有了更加直观的理解。
午后一点半,培训内容转向了基因组学。三代测序方案的介绍,让我们对这一技术有了更加全面的认识。常规基因组测序、T2T基因组、单倍性基因组等概念的讲解,不仅拓宽了我们的视野,也激发了我们对基因组学研究的浓厚兴趣。泛基因组研究方案的介绍,更是让我们发现这一近年来新兴领域所蕴藏的巨大潜力。
整个培训过程中,我们学习到了丰富的知识,也感受到了公司人员的专业和热情。他们的讲解丰富而多样,使我们对生信这一行业的工作领域、从业方向等有了更加清晰的认知。
通过今天的实习,我们获得了宝贵的知识,开拓了眼界。我们相信,这次实习经历将成为我们未来学术生涯中宝贵的财富,激励我们在生物信息学的道路上不断前行。随着太阳的西落,今天的实习培训圆满结束。我们满载而归,期待着在未来的实习中能够愈发的充实自我,增进才干。
2024年7月6日上午,所有人均在宿舍宾馆复习讨论昨天的学习内容,按照分组进行,以五人一组为单位,各组长进行组织安排。
讨论内容主要为昨天的产品培训与结题案例,讨论目的是通过对学习内容的梳理以达到对学习内容加深强化。通过公司产品培训PPT与课程笔记,我们对昨天的学习做了整理,并找出了学习内容的侧重点。其中基因组学、转录组学的作用原理与技术,Hi-C互作、WGBS技术和二三代测序技术及方法,常规基因组、T2T基因组、单倍体基因组概念等内容更是在行业工作所需要掌握的重点内容。
在整个小组讨论过程中,所有人积极参与、态度端正、诚心学习。在各组组长的带领下,我们系统化整理了昨天的学习知识,补充完善学习内容,对于学习内容也有了更深刻的理解。本次讨论会的主要工作基本完成,讨论会也圆满结束
7月6日下午,我们三个小组的同学对上午讨论的内容进行了总结。我们按顺序向石老师汇报了我们的讨论结果,并就其中的疑问进行了答疑。
石老师首先强调,实习的核心不在于琐碎的知识点,而在于构建起生物信息学分析的整体框架。她比喻说,这就像绘制一幅宏伟的地图,我们需要把握的是山川河流的走向,而非每一粒沙砾的形状。她鼓励我们要理解基因组分析的基本流程,如转录组分析、基因组分析等,并要把握中心法则等核心概念,这些都是我们探索生命奥秘的重要指南针。在谈到Hi-C技术时,石老师说这项技术在基因组分析中常用SVP和InDeL方法,它们如同解码生命密码的钥匙,开启了我们对基因组结构的新认识。
她还提醒我们,分子生物学、遗传学和群体遗传学是支撑生物信息学的三大支柱,我们必须对其有一个全面的了解。石老师的话语中透露出对未来的期许,她谈到了考研与就业的选择,科研与工作的本质差异。她指出,公司的成长速度往往比实验室更快,项目的多样性也更丰富。她鼓励我们要根据自身的兴趣和职业规划做出明智的选择,不断适应变化,勇于尝试新事物。
在讨论如何成立一家生物信息分析公司时,石老师提出了宝贵的建议她认为,这样的公司需要聚集一群既精通生物学又熟悉计算机科学的跨界人才,他们能够熟练运用各种生物信息学工具和算法,进行高效的数据分析。同时,公司还需要建立一套完善的项目管理体系,确保每一个环节都能高效运转
2024年7月7日,今天老师安排了公司转录组的主管与我们进行交流,主管首先介绍了一下自己工作经历,从她的介绍中同学们了解到她在公司的不同部门都有工作过,中间因为兴趣等原因换到了其他工作部门,最终找到了适合自己的部门。在此次交流会上,同学们都积极提出自己关于学习上的疑问和对公司所想要了解的方面,她都耐心地为我们解答。同学们积极提问,主管耐心解答,形成一片良好地交流氛围。在此次交流会中,同学们逐渐对公司生信岗位有了更加深刻的认知,也了解到本科生和硕士、博士等求职时的区别。本科生所学习的都是大范围的基础知识,而硕士、博士则是更加系统地学习和熟悉某一个细分的领域,对某个领域专攻,来到公司就能更好地上手进入工作,所以会是公司优先选择选的对象。关于计算机知识的学习,同学们之前一直存有疑问,学院安排了许多计算机有关的课程,涉及到的计算机语言、系统也很多,哪些语言应该精通、哪些语言了解就好同学们一直都有些茫然,在此次交流会上关于同学们的疑惑,主管耐心告诉我们要精通Linux系统、python、Perl、R语言,因为生信的分析大多是在Linux系统内进行的,使用最多的语言就是以上提到的三种。在本次交流会上,同学们都收获颇多,对以后的奋斗方向有了自己各自的打算。
交流会结束后,公司的李总为我们播放了青岛培训基地带领新入职员工参观实验室的视频,使我们对公司的实验环境有了一定的了解,接下来便是在新员工入职培训过程中郑总对基因行业的介绍进而引出对公司介绍的视频,在他的介绍中我们了解到:2009年5月5日百迈克在北京注册成立,logo整体是“双色桥”造型,绿色代表BT,蓝色代表IT,百迈克通过BT+IT技术创新让基因科技走出实验室走进百姓生活。随着公司规模和能力的发展,多次召开承办了全国功能基因组学峰会,众多行业大佬在峰会上提出自己的见解并与众人交流促进行业发展。除此之外我们还了解到百迈克重点开发单细胞及空间转录平台,以实现高端制造领域的布局,研发了国内收款基于微孔的亚细胞级别芯片百创S1000/S2000/S3000等,属于全方位发展的公司。
7月8日上午九点钟,随着新一天的到来,我们迎来了一场关于微生物产品知识的深入培训。培训的开始,我们首先被引导进入微生物的奇妙世界,老师以她丰富的专业知识,向我们介绍了微生物的基本概念和分类,让我们对细菌、病毒、真菌等微生物有了更加系统的认识。
老师详细阐述了微生物群落的结构和功能,以及它们与人类生活的密切关系。通过引用最新的科研进展,如肠道菌群的研究、土壤微生物组的生与死、植物与微生物组的相互作用等,我们对微生物组学的重要性有了更深刻的理解。特别是对Microbiota、Metagenome和Microbiome这三个概念的区分和联系,让我们对微生物组学研究的深度和广度有了更加全面的认识。
随着上午培训的深入,我们学习了微生物组学的研究方法,包括如何识别样本中的微生物种类、它们的行为以及它们如何响应环境变化。通过实际的测序技术介绍,如Novaseq、PacBio CCS、ONT/PB宏基因组测序等,我们对微生物多样性测序、宏基因组测序以及特定菌种研究的技术细节和应用场景有了初步的了解。
午后,培训内容为功能基因定位和遗传进化的专题。老师基于高通量测序技术,向我们展示了如何进行基因定位,以及如何通过遗传图谱和群体研究来识别与特定性状相关的基因。通过联合分析定位策略的讲解,我们对基因组研究的复杂性和精确性有了更加直观的感受。
在遗传进化部分,我们学习了群体遗传学的基本原理,包括基因频率的变化规律以及它们在生物进化中的作用。通过全基因组重测序技术和简化基因组测序技术的应用案例,我们对物种的遗传结构、物种形成机制以及群体进化动态有了更加深入的理解。
在今天整个培训过程中,我们不仅学习到了微生物和基因组学的基础知识,还对实际研究中的技术应用有了更加深刻的认识。公司人员的专业讲解,使我们对生物信息学这一行业有了更加清晰的认知。
7月9日,我们前往公司进行新一轮的实习,在上午,我们首先学习了二代有参转录组分析实操,在学习中,我们了解到从DNA到表型,转录组是中心纽带,有参转录组的基本概念,测序的实验流程和数据介绍,以及FASTQ的格式文件。在展示实操的过程中,其重点步骤为数据质控QC、数据比对参考基因组,使用软件hisat2、组装定量,使用软件Stringite、基因差异表达分析,使用软件DESeq2、基因功能注释及富集分析,使用注释软件和数据库diamond。收集数据后,通过使用特定代码对数据进行处理,达到数据分析和结果可视化的目标。
7月9日上午十点左右,公司通过细菌小基因组作为案例向我们展示基因组Denovo分析实操。首先对我们进行基因组Denovo背景知识介绍,从基本概念到细菌基因组背景,从DNA到表型,公司向我们深入浅出地讲解了基因组测序实验流程和测序数据详细过程。然后公司向我们展示了基因组Denovo分析的分步实操,以二代数据作为分析对象,向我们讲解了每步的重点操作步骤。通过软件代码的实际操作,和对命令参数的详细讲解使我们清晰的理解了对具体步骤方法的分析流程,令我们受益匪浅。
通过蛋白质组学产品培训,我们对蛋白质组学的研究内容和应用有了初步的了解,并且认识到了它在生命科学领域的重要性。掌握了一些基础知识,如质谱技术、蛋白质分离和鉴定等,这些都是进行蛋白质组学研究的必备技能。了解不同的蛋白质组学技术,比如LFQ、TMT、DIA、dDIA和PRM等,这些技术各有特点,适用于不同的研究目的。例如,LFQ和TMT适合于大规模的蛋白质组学研究,而DIA和dDIA则提供了更为精细的定量数据。PRM技术则可以针对特定的蛋白质或蛋白质组进行高灵敏度的定量分析。在学习过程中,我也了解到了蛋白质组学在研究蛋白质修饰方面的应用,比如磷酸化、糖基化、泛素化等,这些翻译后修饰对蛋白质的功能和稳定性有着重要影响。此外,我还学习了如何利用蛋白质组学技术来研究蛋白质的相互作用和网络,这对于理解蛋白质在细胞中的功能至关重要。
本次实习讲座主要围绕质谱技术在生命科学研究中的应用,特别是非靶向代谢组学和蛋白质组学的分析流程。讲座内容涵盖了从基础的质谱背景知识到具体的分析逻辑和方法,旨在为生命科学领域的研究人员提供一套全面的质谱分析框架。主要包括:质谱知识:介绍了质谱技术在生命科学研究中的重要性,特别是在代谢组学和蛋白质组学研究中的应用。强调了蛋白和代谢物在基因与表型之间的桥梁作用。非靶向代谢组学分析:详细讲解了非靶向代谢组学的实验流程,包括数据处理、质量控制、代谢物注释、差异分析等关键步骤。通过使用R语言脚本和各种数据库注释,如HMDB、KEGG和Lipidmaps,展示了如何识别和分析样本中的代谢物。蛋白质组学分析:介绍了蛋白质组学的分析流程,包括蛋白搜库、数据库注释、GO功能分类、PPI网络分析等。强调了这些分析方法在揭示蛋白功能和相互作用方面的重要性。分析方法和工具:讨论了多种分析方法和工具,如ROC曲线、k-均值聚类、韦恩图等,以及它们在个性化分析中的应用。展示了代谢组学和蛋白质组学在生命科学研究中的实际应用,包括疾病诊断、生物标志物发现等方面。本次讲座为提供了一个深入了解质谱技术在生命科学研究中应用的机会,特别是非靶向代谢组学和蛋白质组学的分析流程。通过讲座,研究人员可以更好地理解如何利用这些技术来揭示生物体内的复杂调控网络和关键基因通路,从而推动生命科学研究的进步。此次讲座让我们受益匪浅。此外,赵院长也对我们实习的情况进行关怀和检查,与几位同学交流了关于本次实习的看法以及有什么不足并指出深圳研究院的实操机会值得大家关注,还请我们吃了水果
2024年7月10日的清晨,我们一行人满怀期待地踏入公司大门,准备迎接一场知识的盛宴。上午九点的钟声敲响,我们准时开始了今天的第一场培训——生信原理与Linux系统常用命令的实操。
在这次的培训中,老师首先带我们走进了Linux的世界,从为什么要选择Linux,到如何登录系统,再到如何利用百迈客云平台操作Linux,这些基础而又关键的概念,让我们对Linux有了更为深刻的理解。紧接着,我们深入到了Linux的五大基本命令模块:目录文件操作、用户管理、进程管理、压缩解压缩以及文本处理。每一个模块都像是一把钥匙,解锁了Linux系统的新功能。在目录文件的学习中,我们学会了如何使用`mkdir`创建目录,`rm`来删除文件和目录,以及`pwd`显示当前工作目录等操作命令。随后,用户管理的篇章开启了,`su`的切换让我们体验了不同角色的视角,而`chmod`则让我们掌握了改变文献权限的能力。进程管理的课堂更是生动,`top`和`ps`如同显微镜,让我们观察到了进程的状态,而`kill`则是一把刀用来终止无用的,僵死的进程。压缩命令`tar`和`zip`,以及它们的解压缩伙伴`unzip`,让我们在面对庞大的数据时也能游刃有余。而当培训接近尾声,老师介绍的文本处理命令`cat`、`less`、`head`、`tail`、`sort`和`uniq`,帮助我们更有效地查看和处理文本文件,更是让我们在文本的海洋中乘风破浪。
经过短暂的休息,我们迎来了下午的培训——Perl编程语言介绍以及百迈克云平台APP和小工具介绍和实操。
Perl编程语言介绍课程伊始,老师便带领我们进入了Perl的世界,从程序的基本结构讲起,包括程序路径声明、遵循`strict`规则、变量的声明与赋值等,为我们勾勒出Perl程序的骨架。这不仅让我们对Perl有了一个整体的框架认识,也为我们后续的学习打下了坚实的基础。随着课程的深入,我们进一步探索了Perl中的核心元素——数据类型。老师详细讲解了标量、数组、哈希等,不仅介绍了它们的声明方式,还通过实例演示了它们的操作和应用,让我们对Perl的数据处理能力有了直观的体验。在掌握了数据类型之后,我们又迈入了Perl函数与控制结构的学习。老师为我们细致地讲解了函数的定义和调用,以及条件语句和循环语句的运用。这些控制结构如同Perl编程中的交通枢纽,引导着程序的流转和决策。通过这些知识的学习,我们对Perl的代码编写有了更加清晰的认识,也为实际的编程实践做好了准备。
在百迈客云平台APP和小工具的培训课程中,我们得以深入探索这一科研利器的丰富功能与高效应用。课程伊始,老师便向我们展示了平台的核心优势:一系列专为生物信息学研究设计的数据处理与分析工具,旨在显著提高科研工作的效率与精确度。首先,老师详细介绍了数据上传与管理的机制,包括对浏览器和FTP上传方式的支持,以及数据上传后详尽的管理流程。这不仅确保了数据的快速、安全传输,更为后续的分析工作奠定了坚实的基础。随后,我们进入了分析流程与个性化分析的环节。老师详细阐释了包括有参转录组、微生物多样性分析、代谢组学在内的多种标准化分析流程,并指导我们如何根据具体的研究需求,灵活地进行个性化分析定制,以适应不同科研场景下的特殊要求。此外,课程中还重点强调了云平台提供的丰富教程资源,如视频教程、图文指导等,这些资源极大地降低了用户学习和操作的门槛,加速了科研人员对平台功能的掌握和应用。通过此次培训,我们不仅对百迈客云平台的操作流程和功能特点有了全面而深入的理解,更对其在生物信息学研究中的实用性和便捷性有了直观的体验。
随着今天培训的圆满结束,我们满怀信心地准备将所学知识和技能应用于未来的学习工作之中,以期在知识积累与探索的道路上取得新的突破。
七月十一日早晨,梅雨季后的闷热已经消散许多,而本次的实习也已接近尾声。
再度迈入公司大门,坐在会议室,单细胞测序产品的讲解逐渐拉开序幕。
公司的讲师针对单细胞测序的技术原理、工作流程、应用领域等进行了详细讲解。
单细胞测序技术通过微流控和油滴包裹技术实现对单个细胞的高通量转录组分析,揭示细胞间的异质性。这项技术自2011年以来经历了显著的技术进步,从初步应用到普适化,成本也大幅降低。它不仅应用于转录组分析,还拓展到免疫组库和ATAC等多组学研究,为生物学研究提供了新的研究维度,在诸如医疗卫生、临床应用等多方面都展现出巨大潜力,随着技术的不断进步,其应用领域、作用效果都越来越宽、越来越好,是一项不可估量的新兴技术。
单细胞测序产品的结题报告讲解结束,短暂的休息后,空间组学的产品讲解也随之开始。
空间组学是一种新兴的生物技术领域,它通过高通量测序技术结合空间信息,研究生物样本中基因表达的空间分布和组织结构。这项技术能够揭示细胞类型、组织区域之间的相互作用,以及基因如何在不同空间位置发挥功能。讲师提到,空间组学作为一个新兴的技术领域,其在农学、神经科学、免疫治疗、转录调控等多个细分领域都有着广泛而深刻的应用价值,作为一项前沿的技术,未来的发展同样不容小觑,需要我们时刻关注。
中午,各小组成员开始对本次实习的最终小组汇报进行最后的修改和完善,力求呈交一份完美的答卷。
下午四点,各小组的汇报准时开始,同时也邀请到了公司的三位骨干成员前来指导。在各位公司骨干、老师和同学们的注视下,各小组开始了本次最终的实习汇报。
各小组按照第三组、第四组、第五组的次序依次进行了汇报。三个小组的汇报均总结了此次实习所讲授与学习的主要内容,而侧重点又有所不同,对于本次的实习,也都得到了不同的、独特的收获。
在汇报后,各小组与老师、公司骨干及其他小组的成员进行了亲切友好的答疑,对于整体的实习以及汇报内容进行了更加深入的讨论。
汇报结束后,公司的骨干成员,深度参与了本次实习的王年经理对于本次参加实习的同学发表了自己的建议。他提出,生物信息学在生物领域中的就业条件相对较好,但也要注意到如今就业形势越来越严峻,需要不断的提升自我,提高编程能力和专业知识,明确发展方向和职业道路,脚踏实地,仰望星空。