2024年度22级生物信息学暑期实习(天津篇)

创建于07-04
阅读 812
收藏TA

需扫码在手机上打开
文章后点击更新提醒

随着7月的来临,河南大学2022级生物信息学专业迎来了2024年度暑期实习。本次实习以企业实践作为主要的实习形式,通过实地学习和实践操作充分提高学生们专业和实践能力。

在充分考虑各同学的意向和能力后,本次实习提供两种方案:北京百奥华兴公司实习(天津组)、北京百迈客公司实习(武汉组)。本美篇将叙述天津组的实习进展情况。

       依照日程安排,北京百奥华兴公司于5月18日在生命科学学院进行宣讲并进行实践教学基地揭牌仪式。在本次会议上,北京百奥华兴公司的相关负责人向我们详细介绍了其公司特色和公司主要业务,充分展示了相关生物科技公司的架构模式。通过本次会议,同学们可以充分了解类似于北京百奥华兴基因科技有限公司的小微企业的企业特色和企业规划,为同学们日后的学习、就业等层面提供了宝贵的经验。

       在北京百奥华兴公司宣讲一周后的5月23日,生命科学学院组织2022级生物信息学专业全体学生进行了北京百迈客生物科技有限公司宣讲会并进行了实习实践教学基地揭牌仪式。宣讲会上,北京百迈客的相关负责人向我们介绍了百迈客公司的公司地位、规模及国内外发展规划,充分展现了中国目前高新生物科技公司的现状。经过本次会议后,各位同学均充分了解到了目前中国生物信息相关公司的最新发展水平以及生物科技企业对人才的需求和要求。通过本次会议,相信同学们可以更为合理地规划剩余大学时间的学习方案,不仅为未来就业打好基础,也更为未来在中国生物信息领域做出卓越贡献打好基础。

       夏雨匆匆,洗去一学期的风尘。在7月1日,有些许小雨,生命科学学院赵海鹏院长带头组织了22级生物信息学专业全体学生进行了“2022级生物信息学专业赴企业实践动员会”。本次会议上赵院长以及李靖宇老师从多方面向我们介绍了本次实习对于我们未来就业选择以及科研选择的重要性。同时,李靖宇老师还着重从实习各角度向我们强调了安全方面的注意事项,充分提醒了同学们加强安全意识和安全防范。在动员会中,石艳云老师还详细为同学们介绍了本次实习的日程安排和相应内容,使同学们有效规划个人实习安排,为实习做好准备。

      近日,我们共进行了两次公司宣讲会以及一次2022级生物信息学专业赴企业实践动员会。通过这三次的动员会,同学们深刻感受到了本次实习的意义以及重要性。同时,相信三次的动员会也必定使同学们对接下来的生物信息学学习生涯有了新的理解、规划以及目标。

       在天津组成员到达宿舍园区后,天津组的师生进行了集体合影。合影后,公司相关负责人热情地为各位师生接风洗尘。在餐桌上,同学们和老师相谈甚欢,甚至将美食抛之脑后。公司负责人还详细地为我们介绍了本次实习的相关内容和要求,使同学们充分了解本次实习。最后,公司负责人衷心预祝我们实习圆满成功。

       7.5日早上八点半,我们在宾馆楼下集合完毕,由吴海刚老师带队步行到公司进行学习,九点到达了公司。首先由百奥华兴创始人龚老师向我们介绍百奥华兴基因组育种一体化平台,主要包括基因组育种流程、核心技术和关键平台。然后产品经理王老师向我们详细介绍了此次实习每天都具体课程。

       今天上午的学习内容为了解行业动态和热点方向,以及了解市场上常见的基因组、重测序、转录组、表现组等产品。    产业分为上游、中游和下游。上游为基因测序仪器(国内起步初期,国外寡头垄断),耗材和试剂的供应商。中游为服务的提供商(本土竞争激烈,聚焦细分潜力赛道),下游主要为医疗机构,科研机构,制药机构,公安机关及个人用户(应用领域广泛,发展周期差异化)。国内市场整体处于刚起步阶段,国内市场规模增速高于全球,上升空间巨大。临床应用市场发展空间巨大。

       下午两点我们在宾馆楼下集合,两点半到达公司,于老师还贴心的为我们准备了哈密瓜。下午的学习内容为二代、三代测序平台与原理,二代测序技术原理主要学习了illumina、T7,三代测序技术原理主要学习了pacbio、Nanpore。

        第二代DNA测序,通量高,成本低,能一次并行对几十万到几百万条DNA分子进行序列测定,缺点是读长短。其中较为主流的T7利用了滚环扩增技术(RCA):以单链环状DNA为模板,在DNA聚合酶作用下进行滚环扩增,将单链 环状DNA扩增到 100-1000拷贝扩增产物称为DNB。三代测序技术原理——ONT(单分子测序技术),将原来的荧光信号改成了电信号,实现了纳米实时测序。Pacbio利用了零模波导孔技术(Zero-Mode Waveguides, ZMWs),激光照亮纳米 孔 底部锚定DNA聚合酶的位置,荧光dNTP被激光照射,发出荧光, 检测荧光,识别碱基。

       今天是我们在公司正式学习课程的第一天,收获了非常多的有用的信息和技术知识。在上午讨论的时间中有同学提出来了在测序行业中有哪些具体的工作岗位,产品经理向我们介绍了各个部门的岗位分布,这让我们对今后的职业规划有了更清楚的认知。

       通过今天的课程我们了解了了高通量测序行业现状与发展趋势,对当前行业动态有了大致的认知,当前国内市场规模增速快、上升空间大,也让我们对今后的工作充满了期待和信心。

       今天是7月6日,一个阳光明媚的日子。我们依旧是在八点半在楼下集合,在吴海刚老师的带领下一同前往公司进行学习。今天上午所学习的内容对于我们来说并不陌生,正是我们所学过的Linux操作系统。因为同学们都具有一定的linux基础,所以老师快速地将基本知识和基本操作进行了回顾和讲解,并将原本的课程稍作改变,下午的python课程也在上午完成。

       上午的课程中,我们重新温习了以前所学的内容,包括Linux基本介绍、基本命令的用法、Slurm高性能作业调度和管理系统。不同的是,实习过程中对于Linux的学习更加倾向于实践应用,目的在于让我们更好地为实际运用打好基础。然后李学科老师向我们介绍讲解了Python的知识,因为python是我们本学期的学习课程,同学们基础较为牢固,因此并没有太大的问题。

       在下午的学习中,老师让我们将所学的程序编程与实际的问题结合起来,给我们出了几道简单的编程问题,让我们明白到在实际应用过程中编程是一个非常灵活,需要自身有一定的知识储备才能顺利完成,即便是很简单的问题对我们来说还是颇有挑战性。

        今天是实习的第二天,我们在公司学习的内容让我们更加理解了计算机在生物信息学问题解决过程中的应用,对于日后学习有了更为清晰的认知和规划。同时,通过往返公司路上与吴海刚老师的交流,我们了解到了很多关于公司运行的模式以及我们未来可能在其中扮演的角色。总结过后,我认为今天的实习让我们获益匪浅,今天是收获满满的一天。

       今天是实习的第三天,同样也是星期日。按照公司安排,这是难得的一天休息日,不过时间是宝贵的,尤其这是学校为我们争取在公司实习的时间。因此,我们安排了一次简单的会议,对前两天的实习内容进行总结以及对学习内容巩固强化。

       会议刚开始,为让刚刚前来负责我们实习的高巍老师对我们快速了解,我们分别进行了自我介绍。

       在会议上,高巍老师非常关心我们的实习间的学习情况,在同学们完成自我介绍之后,为我们提出了一些学习和生活上的建议。

        在七月五号下午,我们有幸参加了公司对一些实战内容的培训,在结束之际也为我们布置了一些作业。因此,这次会议的另一个主要目的是进行作业探讨。

       会议中主要是各同学分别讲解了自己的解题思路和完成过程。各位同学的思路以及代码的实现都是我们在学校的学习中内容的精炼,对于我们自己代码的实践应用极具帮助。探讨完毕之后每个同学都觉得收获满满。

       会议结束时差不多到了八点。在返回住宿区的路上,同学们和老师积极探讨了学习和科研上的事情,为同学们以后的人生选择提供了重要参考。

       今天参加的作业会议是一次富有成效的学习与交流盛会。我们围绕Python作业的完成情况进行了深入探讨,从中获得了不少宝贵的收获,并对之后的实习内容充满信心和好奇。基于今天的会议收获,我们计划进一步深化对Python的学习,特别是在数据结构、算法以及实际应用等方面。通过不断练习和实践,提高自己的编程能力和解决问题的能力。

      7月8日是实习的第四天,周一同学们热情高涨,一早就前往公司,为接下来的课程做提前准备。

       今天由王猛老师为我们进行变异检测、群体结构的内容讲解与项目实操。上午是变异检测的基础培训,主要分数据质控、reads比对、变异检测以及群体进化分析四部分。

       下午是对上午内容的实践应用,按照老师提供的检测流程进行操作。首先由授课老师王老师为我们做整个检测流程的演示,并在演示过程中贯穿上午的学习内容,加深同学们的理解。

       因为平时很少涉及到集群式的操作环境,同学尚且不是很适应。在使用途中存在一定问题,大家有不懂的都会及时向老师请教,也会与同学交流讨论。

      今天接触到的是极具生信特色的专业实操课,在上午的讲解中我们先学习了变异检测的流程以及中间涉及到的专业知识,下午进入实操,老师先为我们做了示范以便我们更容易上手。自己上手操作后,更发觉理论并不能完全应用于实际,在日常的理论学习过程中,要更加注重实际操作的应用,学习时就要多思考,不要等到真正用到的时候才去思考这些问题。

       今天是7月9号,是我们实习的第五天。今日我们同往常一样早早起床九点到达会议室等待课程的开始。上午的内容是由喻宇烨老师就育种过程中的基因组选择问题给我们讲解了GS。

       GS是指利用全基因组分子标记对个体基因组育种值实时预测。GS设计思路分为两步1、训练群体建模——优化,缓解过拟合2、育种群体中预测(迭代选择育种值高的个体),喻老师在上午的课程中给我们详细介绍了GS的优势、数据以及模型构建过程和影响因素等。通过喻老师的讲解我们对基因组选择这一算法有了初步的了解,大家课后也积极讨论了老师留的问题,彼此交流学习。

       中午休息期间公司的人热情地请大家吃水果,大家在公司与员工相处的都很融洽,带着公司中大家的照顾与善意,我们短暂休息后开始了下午的学习。

       下午的课程是由曹海涛老师给我们讲解生物信息学中机器学习算法。首先曹老师给我们介绍了机器学习模型的概念。然后就线性回归模型、随机森林、极端梯度提升XGBoost、轻量梯度提升lightGBM和神经网络五种模型给我们详细介绍了机器学习算法的实现。这部分内容我们在R语言深度学习课程中略有涉及,所以理解起来基本没什么问题。在曹老师讲完后大家也都各抒己见,积极与老师沟通交流,发表自己见解。

       今日学习的内容无论是GS模型还是下午讲解的机器学习都与我们之前所学的R语言深度学习上的东西相联系,这也是此次实习的意义所在,大家在实习过程中能真正做到把已学的知识同实践相结合,这不仅有助于我们对知识的掌握,也对我们未来就业或深造有指导意义。

       今天是7月10号,是我们实习的第六天,今天早上孙扬老师带领我们去公司学习。今日的内容主要是分为三部分讲解。

       首先是由王翠颖经理给我们介绍了多组学数据库平台的开发。

       王经理给我们介绍了多组学数据库的组成以及它的开发流程,多组学数据库的开发是一个多岗位合作的过程,在此过程生信充当数据整理的角色在多组学数据库的开发过程中需要定制化方案设计:重点考虑因素有需求、方案构思、网站页面布局与美化。整体要注重用户体验度与网站功能。

       接着王经理对多组学产品的功能给我们分模块展示讲解。

       中午短暂休息后下午的课程由张春阳老师给我们介绍了前端技术在网站开发中的应用。首先张老师从最基础的部分给我们介绍了什么是前端开发,以及前端需要掌握的技术。接着张老师给我们简单介绍了前端发展史。关于React起源张老师也给我们介绍了:它是开源的javascrip库,主要用于构建用户界面。

       关于前端需求分析上,张老师提到性能优化是前端最大的问题。目前前端的需求主要包括:可视化、用户交互需求——用户反馈、数据安全与隐私保护这几个方面。最后张老师讲了关于前端未来发展趋势预测。

        第二部分是由张学科老师给我们讲解了软件开发后端的一些相关知识。

       首先张老师给我们简单介绍了项目开发基本概念一以及企业项目开发流程。接着重点讲解了目前主流后端框架:spring boot;Django的MTV开发模式,并重点给我们演示了如何通过Django搭建一个网站。最后就前后端如何结合实现浏览器的完整应用张老师也给我们做了详细介绍。

      最后高老师也来到了我们的实习地,高老师也十分关心我们实习工作的进展,同学们积极的发言了这次实习的收获以及一些建议

今天是7月11日,实习的第七天也是最后一天。上午由两位老师为我们讲解了网页前后端的连接实操和后端实操。讲解完答疑解惑后,大家进入下午的实习汇报准备中。

中午休息时,于总给我们准备了O泡果奶和旺旺仙贝给大家吃。

下午由两个小组进行总结汇报,大家分享了实习这几天的实习内容、经验和感悟。

最后由梁总总结,分享了自己的创业故事,并对同学们的未来发展提出寄语。这些天给我们上过培训课的老师大家一起在公司合影留恋。

阅读 812
文章由 美篇工作版 编辑制作
投诉