关键词 任务驱动;信息素养;课堂教学;多元评价
中图分类号:G633.67 文献标识码:B
文章编号:1671-4X(2013)27-0102-02
信息社会,学生应该努力学习信息技术,掌握必备信息技能,提高信息素养,适应社会飞速发展。信息素养主要指获取信息、加工信息、处理信息、利用信息、评价信息等含义广泛的综合能力。信息素养以信息技术教学为主要载体,以提高信息能力为最终目标。任务驱动是建立在建构主义理论基础上的互动教学方法,它以问题动机为核心,以师生的互助协作学习为主,通过不断自主探究完成学习任务,建构学生自己的新知识体系。那么,教师如何灵活应用任务驱动教学,激发学生主动学习,有效构建学生全面的信息素养呢?
1 创新问题情境是实施任务驱动教学的必要条件
英国科学家波普尔说过:“科学知识的增长永远始于问题。”问题不但是教师开展任务驱动教学的基本条件,而且是培养学生信息能力的必要条件。因此,教师需研究初中学生的年龄特点和心理特点,积极营造和谐愉快的学习氛围,积极创新问题情境,启发学生思维,激发他们主动探究问题的热情,从而提高学生的信息能力。
如在教“电子贺卡制作”时,教师一上课就为学生创造宽松的情境:“同学们,今天是母亲节,大家用什么方式来表达自己对伟大祖国母亲的感恩之情呢?”学生争着举手发言,有的说用自己的努力学习来回报祖国母亲,有的说长大后当一名合格的建设者……教师引导学生:“是否可以用电子贺卡来表达自己的祝福呢?”学生齐声说可以。教师考考大家:“你们在日常生活中见到过的电子贺卡的制作方法有哪些?请同学们思考后问答。”问题的设置情境开放,极具生活化,激发了学习兴趣。
设置问题难易程度要适当,提出时机要恰当,让学生有话可说。教师在上课时出示已经准备好的几种纸质卡片,包括明信片、手工自制贺卡、印刷贺卡等,让学生说说它们各自的特点。问题激发学生积极思考,围绕问题,他们对贺卡的特点进行了热烈的讨论。教师顺势引导并归纳贺卡的特点,接着提出:“请同学们在PowerPoint中制作一张电子贺卡,并简明扼要地概括制作过程。。
教师采用几个问题引导学生进行自主探究,自己发现答案,让学生体验到学习的乐趣。同时,教师及时的赞扬提高了学生的自信心,使学生获得极大的自豪感和成功感,从而发展学生的信息能力。通过发现问题、分析问题、解决问题的学习过程,学生增强了学习主动性,调动了学习积极性,发展了创新思维。因此,作为教师,要善于创设问题情境,让学生身临其境,在师生和谐的课堂气氛中有计划开展预先精心设计的课堂教学任务,不断提高学生的信息素养。
2 优化课堂教学是实施任务驱动教学的根本保证
信息技术教学的本质是提高和发展学习者的信息能力,因此,扎实开展有效的信息技术课堂教学是是实施任务驱动教学和发展学生对信息的综合运用能力的根本保证。
2.1 营造温馨的学习氛围,创造和谐的任务环境
课堂教学是传播信息意识和发展信息能力的主要阵地。在课堂中,学生通过师生交往、生生交往,有意识地接受学习信息。但这种学习方式要求学生对周围的学习环境中的干扰信息有一定的屏蔽能力。教学实践表明,不同的教学环境形成不同的学习氛围,会影响学生的心理活动,继而影响学生的学习效率。因此,为了降低学生对周围学习环境中无效学习信息的干扰,教师应该有意识地加强自身对信息意识的正确运用,最大化削弱不良、无效信息对学习的影响,用幽默的语言和自然的肢体动作,营造温馨、自然、和谐的生态课堂。教师充满教学热情和富有感染力与表现力的语言,让学生如沐春风,积极思考问题,对问题乐于发表自己的看法,和老师、同学进行探讨交流,从而培养信息素养,为顺利实施任务驱动教学创造和谐的环境。
2.2 运用任务驱动教学优化学习,发展学生信息能力
在信息技术课中,传统教学方式依靠单一的教学手段,以教师为课堂的主体,学生往往被动接受知识和操作技能,扼杀了学生的思维发展,背离了素质教育的初衷。如何优化教学方式,学生的学习才能更加有效呢?巴班斯基曾经提出最优化教学的4个重点:一是用最优化的观点选择教学方案,力求取得最优的教学效果;二是衡量学生实际的学习可能性;三是考虑现有教学条件和可能性,使教学任务和内容具体化,从中区分出主要任务,突出内容的重点;四是针对不同程度的学生,大体区分优、中、差三组,按最优标准,设计对各组不同学生的教学任务。
根据信息技术的特点,结合任务驱动教学方法,笔者从建构主义学习理论角度概括了任务驱动模式下开展有效教学的4个方面:1)明确任务目标和教学重难点;2)课堂学习重点培养学生积极探究和解决问题的能力;3)学生拥有丰富的学习资料;4)通过问题和任务整合学习资源,对学生的学习进行评价交流和反馈。在信息技术教学中,教师预先对教材进行分析,对学生的年龄特点和心理特点进行分析,然后采用对教学总目标围而不打的办法,层层分解,得到若干小任务,让学生通过探究、思考,完成这些极具生活化和情境化的任务,最终攻破教学目标。
任务驱动教学方法打破了教师为主的传统教学理念,实现了师生间学习过程的有效双向互动。但是,在任务的设计中,教师还需注意两个问题:1)确定任务目标,确定任务难易程度;2)在实施任务驱动教学的时候,要考虑学生的现有能力。
如在苏教版初中信息技术上册“有效获取信息”一课中,对于有效获取信息的途径这个总的教学目标,分解成几个小任务:1)思考蜜蜂跳什么舞是发现蜜源招呼同伴?2)请分组讨论蜜蜂跳舞的含义?3)人们是如何发现蜜蜂跳舞规律?4)请同学们通过互联网来重温人类发现蜜蜂跳舞规律的过程及重大意义?5)如何才能在互联网中快速找到蜜蜂跳舞内容的知识呢?6)请同学们谈谈如何有效获取信息?教师明确了有效获取信息这个总的目标后,紧紧抓住“有效”“获取”两个重点,分解出不同的任务让学生完成,通过完成前4个任务,学生就能理解本课的重点获取信息;通过完成5),学生掌握信息的有效获取技术手段——搜索引擎;通过完成6),学生的知识技能、过程方法、情感态度等三维教学目标的各方面得到极大提升,学生感受到成功的喜悦之情。
3 养成质疑习惯是实施任务驱动教学的最佳方法
在倡导实现素质教育、创新教育的今天,教师在任务驱动教学中要坚持以生为本,学生自主探究学习为主,引导学生思考问题、发现问题、解决问题,反复验证问题答案,培养学生的创造精神,提高学生的信息能力,而质疑习惯正是提高学生信息能力的最佳方法。;完成幻灯片背景的更改。任务分为两个层次,第一个比较容易,学生能轻松完成;第二个任务则有不小的难度,学生需要通过分析问题,提出可能的方法。教师要鼓励学生在操作中验证自己的方法,实现幻灯片背景的更改。
爱因斯坦说过:“提出一个问题往往比解决一个问题更重要,因为解决问题也许仅仅是一个教学上或实验上的技能而已。”
4 构建多元评价是达成任务驱动教学的最佳途径
为了促进学生信息能力的全面发展,践行以人为本的教育理念,任务驱动教学中信息技术的教学评价将坚持持续的多元化的动态评价策略,它侧重发展学生在学习过程中的自我评价和自我完善,摒弃陈旧的死抱着成绩的经验主义观点、一成不变的单一评价标准。构建多元化的评价使学生获得了亲身参与探索的体验后的成就感,提高发现问题和解决问题能力,是学生展示自我信息能力的最佳途径。
二者的区别体现在二个方面:1)传统的评价方式,大都是终结性评价,难于体现对学生学习过程的科学评价,往往成为优秀学生的独家展示,无法针对绝大部分学生的学习进行即时性评价,挫伤部分学生的学习积极性,不利于提高学生的信息能力;2)传统的评价往往将学生对知识和技能的掌握情况放在评价的首位,忽视了学生的全面发展和个性差异,综合能力评价和创造能力的评价内容相对偏少。而结合了传统评价优点的过程性评价在任务驱动模式下应运而生,它对新课程三维目标中包含知识与技能、过程与方法、情感态度与价值观几个方面的要求在评价中都得到完整体现。
例如,在学习第1章第2节“有效获取信息”后,学生学习了“搜索引擎的使用”,教师在任务完成结束阶段设计了学生进行自我评价的问题:“我使用搜索引擎进行关键字检索时使用的技巧有那些呢?”学生针对这个问题,从自身实际经验出发,展开热烈的讨论,答案非常精彩丰富。通过对问题的积极评价,学生对自己的探究思路和思维方式有了新的,建立了自信,展示了能力,促进学习的发展。
作为新时代的教师,面临着有差异学生共同提升信息素养和信息能力的需要。因此,教师要不断完善任务驱动教学方法,不断增强个人的教学业务能力,不断提升教学水平,引导学生自主学习、学会学习,从而探索出培养学生信息能力的有效课堂教学思路。
参考文献
[1]黄雯霞.中职计算机任务驱动教学方法的探究[J].新教育,2010(z1):110.
[2]张菊贵.信息技术与学科课程整合的目标、原则及教学模式的探索[J].中国教育技术装备,2003(12):23-24.
[3]贾智荣.课改中信息技术教学方法的探讨与实践一则:“学导式+任务驱动式”教学法的应用[J].网络科技时代,2007(13):103-105.
生物学科是一门实验性较强的学科,其实验教学对学生知识体系建立、能力发展的重要性不言而喻。但是有些生物实验时空跨度大、有些涉及有危害的材料和试剂,因此难以在目前本科生实验教学中实施。此外,还有一些实验需要使用昂贵、精密仪器,其台件数往往不能满足本科生实际操作需要。因而现有的生物学真实实验教学体系并不完整,影响了学生全面掌握生物学实验技能、制约了学生综合创新能力的发展。
随着现代教育技术发展,采用虚拟仿真技术、计算机图形图像技术等生成逼真的实验场景,可以在虚拟情境中完成真实情况下难以甚至不能实现的实验内容。因此,虚拟仿真实验教学资源的开发顺应而生,虚实结合的新实验教学体系为培养现代生物学创新人才提供保障。
一 虚拟仿真实验教学资源建设的紧迫性
《国家中长期教育改革和发展规划纲要(2010-2020年)》指出,“信息技术对教育发展具有性影响,必须予以高度重视”。《教育信息化十年发展规划(2011-2020》>要求推动信息技术与高等教育深度融合,创新人才培养模式。发展规划还明确了建没各级各类优质数字教育资源的工作目标,提出要遴选和开发1500套虚拟仿真实训实验系统。
教育部在建设国家级实验教学示范中心加强实验教学基础上,进一步提出建设国家级虚拟仿真实验教学中心,这一举措具有重大意义。虚拟仿真实验教学中心重点开展资源、平台、队伍和制度等方面的建设,形成持续服务实验教学,保证优质实验教学资源开放共享的有机整体。特别对虚拟仿真实验教学资源的建设提出了具体要求:即以培养学生综合设计和创新能力为出发点,创造性地建设与应用软件共享虚拟实验、仪器共享虚拟实验和远程控制虚拟实验等优质教学资源,推动信息化条件下自主学习、探究学习、协作学习等实验教学方法改革。
二 生物学虚拟仿真实验教学资源开发的必要性
生物学是21世纪自然科学的重点学科之一,对人类社会的可持续发展具有重大影Ⅱ向。生物学也是一门实验性学科,通过实验教学,提升学生的观察能力、发现问题和解决问题的能力,激发学生对生命科学研究的兴趣和灵感,培养学生的创新能力和实践能力。
然而,由于生命科学前沿理论和技术发展迅速、生物学实验系统性强、时空跨度较大、操作较为繁复、某些实验材料存在一定危险性以及某些实验需要昂贵仪器等,造成目前本科生真实实验教学资源的局限性,具体表现在:
因生物材料的生命特质原因,有些生物学实验往往周期较长,如动植物的发育实验、生态学的种群互做实验、生物进化实验等。在有限的实验课时内,现有的真实实验往往是片段的、不连续的,大尺度时空跨越的实验内容基本没有,造成学生知识体系和实验技能的不完整。
目前的生命科学研究已经深人到在分子水平揭示生命现象的本质,相关的实验过程往往是微观的、抽象的,在本科生实验教学中开展相关真实实验一方面成本高、消耗大,一方面传统实验手段无法帮助学生直观了解微观抽象的实验过程,从而影响实验教学效果。
现代的、先进的实验技术推动了生命科学发展,然而有助于学生理解前沿理论的实验内容难度大、复杂程度高、往往需要使用昂贵的大型科学仪器设备,在本科实验教学中难以广泛实施,使得学生不能及时了解、跟进先进的实验技术和理论知识。
生物实验可能涉及伤害的、危险的、污染性的实验内容,因为现有本科生真实实验教学条件有限而不能实施。例如致病菌、病毒、血液样品、同位素等等,涉及这些实验材料和试剂的实验内容在目前的本科生真实实验教学中常常都是回避的,导致学生的知识结构不完整、不系统。
生物技术工艺实验系统化程度高、周期长、成本大,在以往有限课时的本科生真实实验教学中,仅能安排个别常规技术,难以完成完整的工艺流程。学生在工厂车间的实习也往往无法接触企业的核心技术和工艺,只能粗略的浏览生产过程,没有落实学生应用能力的培养,造成学生理论和实践的脱节。
总之,现有的真实生物实验的局限性在一定程度上了学生现代生命科学的视野、影响了学生对先进理论本质的认识以及系统知识体系的形成、制约了完整生物学实验技能和综合能力的培养、不能更好的促进学生科研创新能力和实践能力的培养。
随着生物科学的迅猛发展和人才培养要求的不断提高,生物实验教学的内容愈来愈丰富,要在有限的实验教学课时内扩大教学量、提高教学质量和效率,必须对传统生物学实验教学内容和方法进行改革。虚拟仿真实验作为真实实验的重要补充和扩展,既有仿真性、经济性、安全性的优点,又能保证生物学实验的系统性、综合化,与传统真实实验有机结合,可以使学生开拓视野,获得更为全面的技能训练,掌握完整的生命科学知识体系,对培养学生观察能力、思考能力、创新能力和实践能力具有重要意义。
三 虚实结合的实验教学新体系在综合创新人才培养中的重要性
根据我校生物科学、生物技术专业人才培养目标,结合我校生物学学科特色,我校开发的虚拟仿真实验教学资源可以概况为4个模块:秦岭生物学野外实践能力培养模块、现代生物学综合创新能力培养模块、生物学教师实验教学能力提升模块以及生物技术工艺仿真实训模块。虚拟仿真资源与现有的实际操作实验教学项日相互融合和互补,搭建了较为完备的“分层次、多模块、系统化”的本科生生物学实验教学体系,使学生视野得到开拓,对生命现象过程认识更全面,对知识体系的掌握更系统,同时课题式的仿真实验项目能点燃思维、激发兴趣,加强了本科生的创新精神和实践能力的培养。
陕西师范大学理科(生物学)基础科学研究与野外实习基地被批准为国家级实践教学基地,每年对全国甚至海外高校开放。然而因环境承载能力、后勤保障能力等因素,进入基地进行实习的学生有限。我们充分利用秦岭资源,依托国家级野外实践教学基地,对生物学宏观性、时空大尺度实验进行仿真,为学生提供了新的实验资源和学习模式,学生可以在这个虚拟环境中开展现实中无法实现的大型野外生物实验、生态系统实验等。同时这些教学资源还可以共享给更多的来自全国各地的学生。
生命科学研究早已深入到分子水平。我们将细胞、分子水平的微观生命反应可视化,将抽象的前沿理论和技术形象化,为学生提供了形象逼真的新型实验教学资源,提供了以计算机为载体、信息技术为手段的新型学习方式。我们开发的虚拟仿真实验教学资源运用现代信息技术、教育技术,将学科前沿、研究热点及学院教师的科研成果引入实验教学中,将真实的生物学实验过程中极为迅速、经典技术难以跟踪、肉眼甚至现代科学仪器无法观察到的分子变化以及相互作用,借助计算机模拟实现其可视化,形象地描述以往无法给学生展现的微观生命世界,使学生能更直观的深刻理解产生生物实验现象的本质与详细过程。
生物技术、生物工程是生物学在人类社会的实际应用,有突出的价值和发展空间。以往学生进行生物技术、生物工程实训需要进入药厂、食品厂、酒厂等等的车间、工厂。因企业经济效益和技术保密等,学生只能参与部分生产过程。运用现代信息技术将真实的生产过程引入实验教学中,借助计算机模拟实际生产中昂贵的各种器械、成本高的运行过程,学生通过模拟操作和控制,直观的体验生物技术、生物工程的实际应用。我们为学生提供的生物技术、生物工程实训新平台,可以对学生系统进行产品研发、生产工艺的训练,解决生物技术应用人’才实践技能与生产实际脱节的瓶颈问题。
师范生的培养是我校的特色,生物学专业师范生因生物学这一个实验性学科的特殊要求,必须在掌握生物理论教学能力的同时锻炼实验教学能力。而目前的现状是我国54.4%的中学没有专职生物实验员,实验前材料和仪器准备不充分;因生物实验室和仪器设备短缺,能开出10个以上实验项目的中学很少;还有11.8%的学校一直没有开设生物实验课程。师范生在进行教育实习的时候基本不会进行实验教学的课程设计、课堂教学等实习内容。中学生物教学经典实验的虚拟仿真,给生物学专业师范生搭建了中学生物学实验室的真实情境,可以进行中学生物实验课的模拟教学训练,锻炼了师范生的实验教学技能。特别是基于这样的虚拟平台,多名学生可以同时在任何时间、任何地点、面向任何受众进行教学模拟,并可以反复演练,充分反映了虚拟仿真实验教学的高效性、便捷性和经济性。同时,该平台可以共享给在职中学教师进行继续教育培训;电可以共享给很多没有实验条件的中学,供中学生远程登录完成实验内容等,重复发挥“虚拟仿真实验中心”的开放共享特色。
四 虚实结合的实验教学新体系的优点
我校生物学虚实结合的实验教学体系的优点体现在:第一,紧紧结合我校生物科学、生物技术专业学生的培养目标和生物学各类实验的特点,可以选择特定的实验模块作为必修、或者选修的内容,发挥虚拟仿真实验可视化、虚拟操作的功能,突破传统实物生物实验教学的固有局限性。第二,以传统实验的亲历性巩固学生的事实经验,以虚拟仿真实验提升学生获取科学事实的能力、拓展科学思维、锻炼实践能力,有效解决了现有生物学实验教学资源局限性问题,为培养学生全面、系统的知识体系和合理、前瞻的技能体系开辟了新途径。第三,虚拟仿真实验所具有的普适性,使其辐射面广、受众广泛。除我校生物学相关专业在校本科生、研究生以外,我校承担的国家教师教育、西部教师培训计划等均可受益。同时,对在中学任教的生物学教师开放,提高其业务素质,服务我国基础生物学教育。
生物学虚拟仿真实验教学中心是我校生物基础实验教学中心的重要组成部分,以虚拟仿真的技术手段完成不可及、不可逆等实验内容,以新型知识载体的形式和真实实验相互补充,从而实现虚拟实验与真实实验协同育人、课内课外一体化的实验教学新体系,探索了虚实结合的生物学实验教学新模式,为培养现代生物学综合创新人才奠定了基础。
参考文献
[1]国家中长期教育改革和发展规划纲要工作小组办公室.国家中长期教育改革和发展规划纲要(2010-2020年)[Z].2010.
生物信息学主要由基因组学、蛋白质组学、系统生物学、比较基因组学、计算生物学等学科构成,主要涉及的内容有生物数据的收集、存档、显示和分析,体外预测、模拟基因及蛋白质的结构和功能,对生物的遗传基因图谱进行分析处理,对大量的核苷酸和氨基酸序列进行比对分析,确定进化地位等。从生物信息学的概念及其涉及的内容中可以明确生物信息学不是一门的学科,所以要求教师在教学过程中掌握多领域的知识和技能,才能较好地把握该课程。
1.高等数学和统计学基础
生物信息学将数学和统计学作为主要的计算理论基础,主要包括数学建模、统计方法、动态规划方法、数据挖掘等方面。此外还包括隐马尔科夫链模型(HMM)在序列识别上的应用,蛋白质空间结构预测的最优理论,DNA超螺旋结构的拓扑学,遗传密码和DNA序列的对称性方面的群论等。因此,在生物信息学教学过程中要求教师具备数学及统计学的计算方法的基础知识,能够利用牛顿迭代法、线性方程回归分析、矩阵求拟、最小二乘法等进行数学建模和计算,从而对基因和蛋白质序列进行比对、进化分析和绘制遗传图谱等。
2.生物科学基础
生物信息学包含的生物类学科有,生物化学、分子生物学、遗传学等基础学科,基因工程、蛋白工程、生物技术等应用学科。根据其课程特点,学生在学习生物信息学课程前需要学习生物化学、分子生物学、遗传学、基因组学、蛋白质组学等基本生物学课程,对于基因序列、蛋白质序列、启动子、非编码区等概念有深刻的理解,同时需要对一些重要的生物学数据库有一定的了解,如美国基因数据库(GeneBank)、欧洲分子生物学实验室数据库(Embl)和日本核酸数据库(DDBJ)等。此外,要求学生能够利用生物学数据库查找基因序列、蛋白质序列、基因及蛋白质结构模型,能够读懂数据库中基因和蛋白质的信息注释,能够计算蛋白质序列的分子量和等电点,能够为扩增特定的基因片段设计引物,能够对特定物种进行系统发育分析等。
3.计算机科学基础
。所以,学生在学习生物信息学的过程中需要了解和掌握一些常用的生物信息学软件,如BLAST和FASTA序列比对分析软件,Oligo和Primer引物设计软件,VectorNTI、DNASTAR、DNASIS等综合分析软件。此外,学生还需要学习和掌握一些常用的计算机语言,如正则表达式、Unixshell脚本语言和Perl语言。利用生物信息学在处理和分析海量生物数据的过程中,计算机软硬件资源需要配合处理分析软件的运行,因此要求计算机操作系统使用Unix和Linux操作系统,这些操作系统需要大量的操作命令进行输入执行过程,对于经常使用Windows操作系统的学生来说是一个较难跨越的障碍。
二、生物信息学课程教学中存在的问题
目前国内大多数高校的生物信息学教学采用传统的教学模式,即以课堂式的理论教学为主,缺乏必要的实践教学。理论教学模式固定、教学方法单一、教学内容狭窄,通常是介绍性、科普性的课程,甚至作为公选课程。少数高校开展生物信息学的实践课程教学,但多以验证性实验为主,缺乏和专业相适应的综合性、设计性实验,而开放性实验更无从谈起。
1.教学模式固定单一
生物信息学在内容层面涵盖诸多学科领域,注重应用性和实践性。然而,目前大部分高校把生物信息学作为一门孤立的课程,这导致教师需要将大多数课程内容压缩到一门课程进行教学,在有限的教学时数下灌输大量内容,增加了学生学习的难度,降低了教学质量。再者,大多数高校仅开展生物信息学的理论教学,忽视实践教学过程,造成生物信息学理论与实践内容的脱节,使学生在学习完理论知识后难以深入理解和吸收,无法将所学的知识应用到后续的工作和学习中,最终未能体现出该门课程的价值。
2.教师专业背景薄弱
作为一门交叉学科,生物信息学的教学要求教师具有较强的数学、生物学和计算机科学背景。然而,目前从事生物信息学教学的教师即便具备深厚的生物学背景,但是多数教师在数学和计算机方面较为薄弱,并不具备完整的生物信息学知识体系,对生物信息学发展趋势也了解不多。在师资缺乏的情况下,院系开设生物信息学课程,教师为了完成教学任务,仅仅在教学中进行介绍性的讲解,在课程考查方式上通过小论文、综述和课外活动等方式完成该课程的学习。因此,无论是理论教学还是实践教学均无法实现该课程大纲的要求,从而影响学生对生物信息学课程的理解和掌握,生物信息学的实践操作能力更无从谈起。
3.实践教学薄弱,专业教材缺乏
生物信息学实践课需要学生在网络环境下用计算机学习NCBI数据库的检索与使用、序列比对分析软件的应用、蛋白质空间结构图视软件的应用、序列拼接软件的应用等。但是目前,大多数高校开设的生物信息学课程多以理论教学为主,实践教学课时非常少或者为零,学生对于生物信息学课程的学习仅仅通过教材上抽象的文字描述进行理解和掌握,这导致学生在理论课中学到的知识无法在实践课中进行验证或操作,严重影响了生物信息学的教学质量,也偏离了教学大纲中强调的重在培养学生实践操作能力的培养目标。另外,目前还没有适用于生物科学专业的生物信息学教材。国内各大高校使用的教材多为国外教材的影印版或者中文翻译版本,这些教材偏重介绍生物信息学的理论和方法,涉及的实践内容较少,学生需要具有较高的相关知识才能接受和使用这些教材。因此,部分高校在生物信息学教学过程中往往使用自家编写的简化教材,从而造成生物信息学教学内容不统一,教学大纲混乱等情况。
4.实践课程经费不足,实践教学环境落后
当今,许多发达国家都很重视生物信息学的教学和研究,积极开展各种生物信息资源的收集和分析工作,培养大量生物信息学人才,为整个生物学的理论研究及其相关产业创新(主要是医药和农业)提供指导和支撑。。国家和高校对生物信息学的教学和科研资金投入力度不大,缺乏必要的仪器设备,生物信息学的实践教学条件得不到保障,比如大多数高校的生物科学专业没有相应的计算机实训室,配套软件也相对匮乏,落后于国际发展水平。
三、生物信息学教学模式改革的探索
1.修改理论和实践教学大纲,编写适用的实践教材
根据当今生物信息学的发展方向,制定和修改理论教学大纲,除了引物设计、基因和蛋白质序列比对、基因和蛋白质结构功能预测等基本内容外,还需添加系统进化树分析、聚类分析、蛋白质互作网络谱图等较为综合的内容。另外,增加实践教学课程比例,充实实践教学内容,结合理论教学内容增加综合性、设计性实验,适当提供科研环境,鼓励开展开放性实验。目前国内并没有系统的、专业的生物信息学实践教材,因此针对高校生物科学专业方向的特点,联合多学科领域(数学、生物科学、计算机科学)编写相应的生物信息学实践教材,在制定、修改实践教学大纲和编写教材的过程中结合学生的接受能力,由浅入深,多设实例和相关练习,使学生循序渐进的理解和掌握生物信息学的原理和方法,掌握更多的生物信息学工具。
通过实践教学把生物信息学教学与科研有机结合起来,能够促进教学与科研的共同发展。。例如,在生物信息学实践教学中多加入生产和科研中遇到的经典实例,鼓励学生利用相关的生物信息学软件及相关的理论和方法解决问题。学生也可以选择自己感兴趣的课题,利用自己熟悉的、合适的生物信息学软件和相关知识开展课题研究。此外,专业教师在指导学生课题研究的过程中还可以发现理论和实践教学的不足,不断的完善生物信息学理论和实践课程大纲和内容,提高教学质量。
3.开展多学科实践结合的教学模式
生物信息学属交叉学科,包含了不同领域的专业知识和技能,为使生物信息学教学达到教学的目标,该课程教学需要采用多学科实践结合的教学模式。多学科实践结合的教学模式是指联合不同领域、不同学科、不同专业的课程在教学的过程中结合生物信息学涉及到的知识和技能进行基础性、铺垫性教学。比如,在高等数学和统计学的教学过程中,针对生物信息学的需求,适当增加数学建模、统计方法、动态规划方法、数据挖掘等方面的基础内容,同时,开设实例实践教学,使学生理解和掌握隐马尔科夫链模型,牛顿迭代法、最小二乘法等方法的应用原理和规则;在生物科学专业课程设置上,尤其是实践课程的教学过程中,结合生物信息学涉及的引物设计、序列比对分析、基因及蛋白质结构功能预测等方面开展相应的设计性、综合性、开放性实验项目,使学生了解和掌握基本的生物信息学原理及软件的应用;在计算机科学的教学过程中,应根据生物信息学的需求,开设正则表达式、Perl语言、R语言等课程学习,以及增加Linux和Unix操作系统课程学习,使学生在学习生物信息学前打好坚实的基础。值得注意的是,生物信息学课程与其他课程的开设时间和顺序需要有一定的探索和评估,对于开设该课程的时间把握是开展多学科实践结合的教学模式的关键因素。过早开设生物信息学则会导致学生在不具备相应学科基础的条件下跨越式的接触生物信息学,无法理解和掌握相关的知识和技能;过晚开设则会使学生学习了相关学科知识和技能后,由于课程衔接不紧,导致在学习生物信息学时出现理解滞后和无法适应的现象。。
四、结语
>> 案例教学法在《生物信息学》本科教学中的应用 师范院校生物信息学教学的现状分析 医学院校生物信息学教学的探究 面向医科院校生物信息学专业的Java教学实践 面向生物信息学本科专业的《遗传学》教学要点及模式探索 离散数学在生物信息学专业本科教学的开展研究 生物信息学中的机器学习 癌症研究的生物信息学资源 生物信息学中的序列比对算法 师范院校生物信息学本科教学改革与实践 生物信息学数据库及运用分析 生物信息学专业MySQL数据库课程教学方法探讨 生物信息学在生物学研究领域的应用 医学院校生物技术专业生物信息学教学探索 生物背景学生的《生物信息学》课程教学思考与探索 师范院校研究生生物信息学教学改革思考 农业院校生物信息学教学模式探索 探讨医学院校生物信息学创新实践能力培养 中医大数据下生物信息学的发展及教育模式浅析 大数据背景下的生物信息学教学探索 常见问题解答 当前所在位置:l)。此外,还有细菌、真菌、植物等分支数据库。该数据库也有搜索引擎,其内容详细的数据记录了DNA、转录产物、蛋白质和基因突变等信息,使用方便,记录系统、完整,是了解基因结构和功能比较理想的数据库[2]。
2.3 miRBase数据库 microRNA是近年来发现的非编码内源性小RNA分子,其功能主要是调节靶基因的转录后水平的表达,是近年来研究的热点领域。miRBase数据库更新快,包含miRNA序列数据、功能注释、靶基因预测等多各方面,是存储miRNA信息最主要的公共数据库之一(http:///)。目前,新版本(Ver.21)收录了223个物种285个前体miRNA和35 。
2.4 生物分子信号通路数据库 信号通路一词在高中生物就接触到,到本科阶段的《细胞生物学》课程中得以深入学习。据调查,对于本科生而言,他们对信号通路想理解和认识有限,掌握的信号通路都是不完整的。学生在学习时,可借助信号通路数据库检索的方式,搜索某基因所参与的信号通路,并且可以直观的看到该基因在整个信号通路中的地位和作用。信号通路数据库目前比较常用的是WikiPathways数据库(http://)。该数据库集成了主要的基因、蛋白质,允许整个研究者更广泛参与[3]。该数据最大的特点是将基因之间的关系以图形方式显示,使学生直观了解所感兴趣的基因是如何参与到信号通路或生化代谢过程的。
3 常用生物信息学软件及在线分析工具
3.1 DNA序列分析软件 在生物科学本科教学过程中,很多课程如《生物化学》《分子生物学》《遗传学》等,都涉及到DNA序列结构、基因突变等知识点,而且学生掌握到的更多都是一种朦朦胧胧,是懂非懂的知识点。因此,在《生物信息学》课堂上,当讲到采用生物信息学软件进行DNA序列分析时,学生产生了浓厚的兴趣。DNA序列分析的软件有很多,如:BioEdit,DNASIS,DNAStar,DNAClub,DNAMan等,相比较可知,就序列分析而言,我们认为DNAStar软件最常用,且操作简单,可视化功能强大,是地方本科院校学生的最佳选择。
。
3.2 RNA结构分析软件 RNA包含tRNA,mRNA,rRNA和sRNA等多种类型,在蛋白质生物合成过程中起着非常重要的作用。他们的二级结构或高级结构会影响蛋白质合成的效率。因此,对于本科生而言,直观的了解RNA的二级结构,对于掌握理论知识具有重要意义。RNA结构分析的软件有如Mfold、RNAdraw和RNAstructure等多个软件[4-5]。通过比较这些软件获得难易度、优缺点和使用复杂程度,我们发现Mfold已完成多次修订,且实现了网上在线免费试用(http://unafold.rna.albany.edu/?q=mfold),输出结果灵活多样,结果直观,是本科生用于RNA结构分析的最佳选择。
3.3 序列比对软件(在线工具) 序列比对也称序列比较,通过该操作,可以将两个或多个基因(或蛋白质)序列按照一定的规律排列,使学生直观的观察到序列的变异,从而确定序列之间的相似性或同源性。根据序列多少,可分为双序列比对和多序列比对。序列比对的软件或在线工具也有很多,其中多序列比对软件有Clustal(ClustalX和ClustalW)、GCG、BioEdit、DNAMAN和DNAStar件包中的MegAlign等。在这里,适合本科生教学的软件我们推荐MegAlign和DNAMAN。。
3.4 系统发育树构建软件 在生物进化过程中,细胞内的生物大分子(蛋白质、核酸)的一级结构的变化会出现变异(进化),而生物大分子进化速率相对恒定,我们可以根据生物大分子的序列信息构建系统发育树,推断生物进化历史。系统发育树构建的软件有MEGA,PHYLIP,DNAMAN等。在分子进化相关的科学研究中,最常用的是MEGA(即Molecular Evolutionary Genetics Analysis),该软件更新快(目前的最新版本为MEGA7.0 http:///),运行速度快,操作简单,结果直观。因此,在本科教学中,我们推荐MEGA软件作为系统发育树构建的软件。
3.5 Expasy工具 ExPASy,即Expert Protein Analysis System,由瑞士生物信息学研究所维护的蛋白组学相关的在线实用分析平台,整合了很多蛋白质数据资源和分析工具(http:///),涉及蛋白分类、蛋白质翻译、结构预测、相似检索、序列比对等。该在线工具可免费试用,是本科教学过程中值得推荐的分析工具。但是,该工具包数据量大,鉴于本科教学学时的,在教学过程中不宜细讲,可以引入,让感兴趣的同学自学。
4 结语
随着分子生物学和生物信息学的迅猛发展,生物信息学数据库不断完善,生物分析软件越来越多,且各具特色。考虑到地方本科院校实际情况,我们介绍了以上的生物信息学数据库和分析软件(在线工具),并简单总结了它们适合于地方性高校本科教学的优点,给出了合理选择的参考建议,以期为地方本科院校《生物信息学》教学提供参考。
参考文献
[1]Bethesda(MD).The NCBI Handbook[Internet]. 2nd edition[M].National Center for Biotechnology Information(US). 2013.
[2]Yates A,Akanni W,Amode M R,et al. Ensembl 2016[J].Nucleic Acids Res.2016,44(D1):D710-D716.
[3]Kelder T,van Iersel M P,Hanspers K,et al.WikiPathways:building research communities on biological pathways[J].Nucleic Acids Res. 2012,40(Database issue):D1301-D1307.
[4]徐思敏.RNA生物信息相关软件概述[J].科技信息:科学教研,2008(14):398-399.
一、整合生物信息学的研究领域
尽管目前一般意义上的生物信息学还局限在分子生物学层次,但广义上的生物信息学是可以研究生物学的任何方面的。生命现象是在信息控制下不同层次上的物质、能量与信息的交换,不同层次是指核酸、蛋白质、细胞、器官、个体、群体和生态系统等。这些层次的系统生物学研究将成为后基因组时代的生物信息学研究和应用的对象。随着在完整基因组、功能基因组、生物大分子相互作用及基因网络等方面大量数据的积累和基本研究规律的深入,生命科学正处在用统一的理论框架和先进的实验方法来探讨数据间的复杂关系,向定量生命科学发展的重要阶段。采用物理、数学、化学、力学、生物等学科的方法从多层次、多水平、多途径开展交叉综合研究,在分子水平上揭示生物信息及其传递的机理与过程,描述和解释生命活动规律,已成生命科学中的前沿科学问题(摘自:国家“十一五”生命科学发展规划),为整合生物信息学的发展提供了数据资源和技术支撑。
当前,由各种Omics组学技术,如基因组学(DNA测序),转录组学(基因表达系列分析、基因芯片),蛋白质组学(质谱、二维凝胶电泳、蛋白质芯片、X光衍射、核磁共振),代谢组学(核磁共振、X光衍射、毛细管电泳)等技术,积累了大量的实验数据。约有800多个公共数据库系统和许多分析工具可利用通过互联网来解决各种各样的生物任务。生物数据的计算分析基本上依赖于计算机科学的方法和概念,最终由生物学家来系统解决具体的生物问题。我们面临的挑战是如何从这些组学数据中,利用已有的生物信息学的技术手段,在新的系统层次、多水平、多途径来了解生命过程。整合生物信息学便承担了这一任务。
图1简单描述了生物信息学、系统生物学与信息学、生物学以及基因组计划各个研究领域的相关性。可以看出基因组计划将生物学与信息学前所未有地结合到了一起,而生物信息学的兴起是与人类基因组的测序计划分不开的,生物信息学自始至终提供了所需的技术与方法,系统生物学强调了生物信息学的生物反应模型和机理研究,也是多学科高度交叉,促使理论生物学、生物信息学、计算生物学与生物学走得更近,也使我们研究基因型到表型的过程机理更加接近。虚线范围代表整合生物信息学的研究领域,它包括了基因组计划的序列、结构、功能、应用的整合,也涵盖了生物信息学、系统生物学技术与方法的有机整合。
整合生物信息学的最大特点就是整合,不仅整合了生物信息学的研究方法和技术,也是在更大的层次上整合生命科学、计算机科学、数学、物理学、化学、医学,以及工程学等各学科。其生物数据整合从微观到宏观,应用领域整合涉及工、农、林、渔、牧、医、药。本文将就整合生物信息学的生物数据整合、学科技术整合及其他方面进行初步的介绍和探讨。
二、生物数据挖掘与整合
生物系统的不同性质的组分数据,从基因到细胞、到组织、到个体的各个层次。大量组分数据的收集来自实验室(湿数据)和公共数据资源(干数据)。但这些数据存在很多不利于处理分析的因素,如数据的类型差异,数据库中存在大量数据冗余以及数据错误;存储信息的数据结构也存在很大的差异,包括文本文件、关系数据库、面向对象数据库等;缺乏统一的数据描述标准,信息查询方面大相径庭;许多数据信息是描述性的信息,而不是结构化的信息标示。如何快速地在这些大量的包括错误数据的数据量中获取正确数据模式和关系是数据挖掘与整合的主要任务。
数据挖掘是知识发现的一个过程,其他各个环节,如数据库的选择和取样,数据的预处理和去冗余,错误和冲突,数据形式的转换,挖掘数据的评估和评估的可视化等。数据挖掘的过程主要是从数据中提取模式,即模式识别。如DNA序列的特征核苷碱基,蛋白质的功能域及相应蛋白质的三维结构的自动化分类等。从信息处理的角度来说,模式识别可以被看作是根据一分类标准对外来数据进行筛选的数据简化过程。其主要步骤是:特征选择,度量,处理,特征提取,分类和标识。现有的数据挖掘技术常用的有:聚类、概念描述、连接分析、关联分析、偏差检测和预测模型等。生物信息学中用得比较多的数据挖掘的技术方法有:机器学习,文本挖掘,网络挖掘等。
机器学习通常用于数据挖掘中有关模式匹配和模式发现。机器学习包含了一系列用于统计、生物模拟、适应控制理论、心理学和人工智能的方法。应用于生物信息学中的机器学习技术有归纳逻辑程序,遗传算法,神经网络,统计方法,贝叶斯方法,决策树和隐马尔可夫模型等。值得一提的是,大多数数据挖掘产品使用的算法都是在计算机科学或统计数学杂志上发表过的成熟算法,所不同的是算法的实现和对性能的优化。当然也有一些人采用的是自己研发的未公开的算法,效果可能也不错。
大量的生物学数据是以结构化的形式存在于数据库中的,例如基因序列、基因微阵列实验数据和分子三维结构数据等,而大量的生物学数据更是以非结构化的形式被记载在各种文本中,其中大量文献以电子出版物形式存在,如PubMed Central中收集了大量的生物医学文献摘要。
文本挖掘就是利用数据挖掘技术在大量的文本集合中发现隐含的知识的过程。其任务包括在大量文本中进行信息抽取、语词识别、发现知识间的关联等,以及利用文本挖掘技术提高数据分析的效率。近年来,文本挖掘技术在生物学领域中的应用多是通过挖掘文本发现生物学规律,例如基因、蛋白及其相互作用,进而对大型生物学数据库进行自动注释。但是要自动地从大量非结构性的文本中提取知识,并非易事。目前较为有效的方法是利用自然语言处理技术NLP,该技术包括一系列计算方法,从简单的关键词提取到语义学分析。最简单的NLP系统工作通过确定的关键词来解析和识别文档。标注后的文档内容将被拷贝到本地数据库以备分析。。其结果是获得相关文档簇,可以推断特定文本内容的特定主题。最先进的NLP系统是可以进行语义分析的,主要是通过分析句子中的字、词和句段及其相关性来断定其含义。
生物信息学离不开Internet网络,大量的生物学数据都储存到了网络的各个角落。网络挖掘指使用数据挖掘技术在网络数据中发现潜在的、有用的模式或信息。网络挖掘研究覆盖了多个研究领域,包括数据库技术、信息获取技术、统计学、人工智能中的机器学习和神经网络等。根据对网络数据的感兴趣程度不同,网络挖掘一般还可以分为三类:网络内容挖掘、网络结构挖掘、网络用法挖掘。。网络结构挖掘的对象是网络本身的超连接,即对网络文档的结构进行挖掘,发现他们之间连接情况的有用信息(文档之间的包含、引用或者从属关系)。在网络结构挖掘领域最著名的算法是HITS算法和PageRank算法(如Google搜索引擎)。网络用法挖掘通过挖掘相关的网络日志记录,来发现用户访问网络页面的模式,通过分析日志记录中的规律。通常来讲,经典的数据挖掘算法都可以直接用到网络用法挖掘上来,但为了提高挖掘质量,研究人员在扩展算法上进行了努力,包括复合关联规则算法、改进的序列发现算法等。
网络数据挖掘比单个数据仓库的挖掘要复杂得多,是一项复杂的技术,一个难以解决的问题。而XML的出现为解决网络数据挖掘的难题带来了机会。。随着XML作为在网络上交换数据的一种标准方式,目前主要的生物信息学数据库都已经提供了支持XML的技术,面向网络的数据挖掘将会变得非常轻松。如使用XQuery 标准查询工具,完全可以将 Internet看作是一个大型的分布式XML数据库进行数据浏览获取、结构化操作等。
此外,数据挖掘还要考虑到的问题有:实时数据挖掘、人为因素的参与、硬件设施的支持、数据库的误差问题等。
一般的数据(库)整合的方法有:联合数据库系统(如ISYS和DiscoveryLink), 多数据库系统(如TAMBIS)和数据仓库(如SRS和Entrez)。这些方法因为在整合的程度,实体化,查询语言,应用程序接口标准及其支持的数据输出格式等方面存在各自的特性而各有优缺点。同时,指数增长的生物数据和日益进步的信息技术给数据库的整合也带来了新的思路和解决方案。如传统的数据库主要是提供长期的实验数据存储和简便的数据访问,重在数据管理,而系统生物学的数据库则同时对这些实验数据进行分析,提供预测信息模型。数据库的整合也将更趋向数据资源广、异质程度高、多种数据格式、多途径验证(如本体学Ontology的功能对照)、多种挖掘技术、高度智能化等。
三、生命科学与生物信息学技术的整合
生物信息学的研究当前还主要集中在分子水平,如基因组学/蛋白质组学的分析,在亚细胞、细胞、生物组织、器官、生物体及生态上的研究才刚刚开始。从事这些新领域的研究,理解从基因型到表型的生命机理,整合生物信息学将起到关键性的作用。整合生物信息学将从系统的层次多角度地利用已有的生物、信息技术来研究生命现象。另外,由其发展出的新方法、新技术,其应用潜力也是巨大的。图2显示了生命科学与生物信息学技术的整合关系。
目前生命科学技术如基因测序、QTL定位、基因芯片、蛋白质芯片、凝胶电泳、蛋白双杂交、核磁共振、质谱等实验技术,可以从多方面,多角度来分析研究某一生命现象,从而针对单一的实验可能就产生大量的不同层次的生物数据。对于每个技术的数据分析,都有了大量的生物信息学技术,如序列分析、motif寻找、基因预测、基因注解、RNA分析、基因芯片的数据分析、基因表达分析、基因网络分析、蛋白质表达分析、蛋白质结构预测和分子模拟、比较基因组学研究、分子进化和系统发育分析、生物学系统建模、群体遗传学分析等。整合生物信息学就是以整合的理论方法,通过整合生物数据,整合信息技术来推动生命科学干实验室与湿实验室的组合研究。其实践应用涉及到生物数据库的整合、功能基因的发现、单核苷酸多态性/单体型的了解、代谢疾病的机理研究、药物设计与对接、软件工具以及其他应用。
。
四、学科、人才的整合
整合生物信息学也是学科、教育、人才的整合。对于综合性高等院校,计算机科学/信息学、生物学等学科为生物信息学的发展提供了学科基础和保障。如何充分利用高校雄厚的学科资源,合理搭建生物信息学专业结构,培养一流的生物信息学人才,是我们的任务和目标。
计算机科学/信息学是利用传统的计算机科学,数学,物理学等计算、数学方法,如数据库、数据发掘、人工智能、算法、图形计算、软件工程、平行计算、网络技术进行数据分析处理,模拟预测等。生物信息学的快速发展给计算机科学也带来了巨大的挑战和机遇,如高通量的数据处理、储存、检索、查询,高效率的算法研究,人工智能的全新应用,复杂系统的有效模拟和预测。。
生物学是研究生命现象、过程及其规律的科学,主要包括植物学等十几个一级分支学科。。
作为学科的生物信息学,其基本的新算法,新技术,新模型,新应用的研究是根本。课程涉及到生物信息学基础、生物学数据库、生物序列与基因组分析、生物统计学、生物芯片数据分析、蛋白质组学分析、系统生物学、生物数据挖掘与知识发现、计算生物学、药物设计、生物网络分析等。。
此外,整合生物信息学的人才培养具有很大的国际竞争压力,培养优秀的专业人才,必须使其具备优良的生物信息科学素养,具有国际视野,知识能力、科研创新潜力俱佳的现代化一流人才。所以要始终紧跟最新的学术动态和发展方向,整合学科优势和强化师资力量,促进国际交流。
五、总结及展望
二十一世纪是生命科学的世纪,也是生物信息学快速不断整合发展的时代,整合生物学的研究和应用将对人类正确认识生命规律并合理利用产生巨大的作用。比如进行虚拟细胞的研究,整合生物信息学提供了从基因序列,蛋白结构到代谢功能各方面的生物数据,也提供了从序列分析,蛋白质拓扑到系统生物学建模等方面的信息技术,从多层次、多水平、多途径进行科学研究。
整合生物信息学是基于现有生物信息学的计算技术框架对生命科学领域的新一轮更系统全面的研究。它依赖于生物学,计算机学,生物信息学/系统生物学的研究成果(包括新数据、新理论、新技术和新方法等),但同时也给这些学科提供了更广阔的研究和应用空间,并推动整个人类科学的进程。
我国的生物信息学教育在近几年已经有了长足的进步和发展。未来整合生物信息学人才的培养还需要加强各学科有效交叉,尤其是计算机科学,要更紧密地与生命科学结合起来,共同发展,让我们的生命科学、计算机科学和生物信息学的教育和科研走得更高更前沿。
在1956年美国召开的首次“生物学中的信息理论研讨会”上人们提出了生物信息学的概念[1]。近几年,随着人类基因组计划(HGP)的迅猛发展,各种数学软件以及生物分析软件的出现,将之前积累的大量不同生物基因序列、蛋白质氨基酸残基序列、不同生物种属之间基因序列、蛋白质以及结构序列的保守结构位点进行整合,并据此建立了庞大的数据库系统。而对于这些数据的分析,必须依靠计算机分析技术的不断发展,所以就形成了一门由生物科学、计算机科学、信息科学、应用数学、统计学等多门学科相互交叉的学科——生物信息学技术[2-4]。
生物信息学的基础是各种数据库的建立和分析工具的发展。迄今为止,生物学数据库总数已达500个以上。归纳起来可分为4大类:即基因组数据库、核酸和蛋白质一级结构数据库、生物大分子三维空间结构数据库,以及以上述3类数据库和文献资料为基础构建的二级数据库[7]。常用生物信息学数据库[8-10]:
European Molecular Biology Laboratory(EMBL)——欧洲分子生物学实验室http://ebi.ac.uk/ebi_docs/embl_db/ebi/topembl.html
UK Human Genome Mapping Project-Resource Center(HGMP-RC)——英国医学研究委员会所属人类基因组图谱资源中心 http://hgmp.mrc.ac.uk/default.htm
SeqNet:UK Node of European Molecular Biology Network(EMBNet)——欧洲分子生物学信息网http://seqnet.dl.ac.uk/default.htm
GenBank——美国国家生物技术信息中心(NCBI)所维护的供公众自由读取的、带注释的DNA序列的总数据库http://ncbi.nlm.nih.gov/Web/Search/index.html
National Center for Biotechnology Information(NCBI)——美国国家生物技术信息中心http://ncbi.nlm.nih.gov/
DNA Databank of Japan(DDBJ)——日本核酸数据库http://ddbj.nig.ac.jp/default.htm
Genome Sequence DataBase(GSD)——美国国家基因组资源中心维护的DNA序列关系数据库http://seqsim.ncgr.org/default.htm
Online Mendelian Inheritance in Man(OMIM)——在线人类孟德尔遗传数据库http://www3.ncbi.nlm.nih.gov/Omim/searchomim.html
European Drosophila Genome Project http://edgp.ebi.ac.uk/default.htm
The Institute for Genomic Research(TIGR)——美国基因组研究所http://tigr.org/default.htm
The Sanger Centre http://sanger.ac.uk/default.htm
Swiss Institute of Bioinformatics(Expasy)http://expasy.ch/default.htm
GenomeNet(Japan)http://genome.ad.jp/default.htm
Australian National Genomic Information Service(ANGIS)http://morgan.angis.su.oz.au/default.htm
Bioinformatics and Biology Resources on the Internet
List of other Genome Sites http://hgmp.mrc.ac.uk/GenomeWeb/default.htm
Brunel University Online Teaching Programme http://brunel.ac.uk/depts/bl/project/front.htm
Whitehead Institute for Biomedical Research(WI)http://wi.mit.edu/
WICGR(WI/MIT Center for Genome Research)http://www-genome.wi.mit.edu/
Cold Spring Harbor Laboratory(CSHL)——冷泉港实验室http://clio.cshl.org/
SMI(Stanford Medical Informatics)http://www-smi.stanford.edu/projects/helix/
BNL(Brookhaven National Laboratory)——美国布鲁克海文国家实验室http://genome1.bio.bnl.gov/
Weizmann Institute of Science——以色列魏兹曼科学研究所 http://bioinformatics.weizmann.ac.il/
中国科学院上海生命科学院生物信息中心(BioSino)http://biosino.org.cn/
北京大学生物信息中心(CBI或PKUCBI)http://cbi.pku.edu.cn/
中事医学科学院情报研究所 http://bmi.ac.cn/bio/
1 生物信息学在寄生虫基础研究中的现状
随着HGP的开展[11-12],人体寄生虫基因组研究也受到了广泛的重视。1993年美国人类基因组研究中心对HGP 作了修订,修订后的HGP 将模式生物基因组列入了HGP的内容[13],认为通过对较为简单的模式生物基因组的研究,可为人类基因的功能鉴定提供线索,并可从简单的基因组分析入手建立技术积累经验。人体寄生虫是一类结构较简单的单细胞生物如原虫或多细胞生物如蠕虫[14],是研究模式生物较理想的材料。因此,人体寄生虫基因组计划也已成为人类基因组计划中模式生物基因组研究重要内容之一[15-16]。其中,基因序列测定和新基因的发现是人体寄生虫基因组计划的首要任务。目前应用生物信息学对下列人体寄生虫基因组进行了研究[17-18]:
1.1 恶性疟原虫 基因组计划开展较早,研究表明恶性疟原虫的基因组大小约30Mb,含15000~17000个基因。在GenBank 中已记载的恶性原虫5031个基因顺序资料中,有3755个为抗原/蛋白质的编基因序列。
1.2 利什曼原虫 基因组大小约为35Mb,通过构建利什曼原虫不同时期特异性cDNA文库和长片段基因组文库,已经获得了2000多个EST 序列。
1.3 美洲锥虫 基因组大小为55 Kb,已建立了标化cDNA 文库,BAC 文库和YAC 文库。现已完成了7000个EST序列的测定,3号和4号染色体序列已测定。
1.4 丝虫 基因组大小为100Mb(以马来丝虫代表),至目前为止,在GenBank 中EST 序列已达到16500个,鉴定出新基因6000个,占预测基因总数的1/3。
1.5 硕大利什曼原虫 已有约500个EST 序列进入数据库,均是从含有引导序列的全长cDNA的5端测出的序列,对利什曼原虫的目标是测出至少1500个新序列。
1.6 血吸虫 基因组大小为270 Mb,估计基因数为20000个。血吸虫基因组计划始于1995年,早期研究工作主要是新基因的发现和绘制低分辨率的物理图谱。目前在GenBank中已有的血吸虫基因EST序列超过45900条,3500 个新基因已被鉴定,占基因总数的15%。
2 生物信息学在包虫基础研究中的应用前景
包虫病是一个世界性的流行病,其防治工作倍受各国研究者重视。包虫生活史复杂,同一包虫的不同种株,以及在同一种株的不同发育阶段,不同组织,甚至随着环境的改变,其基因表达变化很大。目前有关包虫的研究还不是很多,研究资源主要集中于研究包虫单个基因的序列及其功能,随着后基因组时代的发展,以及生物信息学的兴起,包虫的研究将从单个基因和功能向全基因组和功能研究转变,从局部向整体转变,从而使有目的地大规模研究疫苗和药物相关基因成为可能。
目前,应用生物信息学在对血吸虫的基础研究中取得了很大的进展。这便给了我们一个提示,可以应用生物信息学对包虫进行基础研究。。
核酸序列线粒体
内核酸线粒体
外核酸总核酸
序列数Nucleotide5625321097相关EST01000210002GSS077
2.1 基因功能预测 一个新基因得到后,接下来的工作就是寻找该基因的功能。序列同源比较是预测基因功能的第一步。利用同源比较算法,将待检测的新基因序列从DNA和蛋白质序列数据库中进行同源检索后,就可以得到一系列与新基因同源性较高的基因或片段。这些基因和片段的已知功能信息就为进一步分析新基因功能提供了具有相当参考价值的导向。最主要的生物学数据库是核酸、蛋白质序列数据库及其三维结构数据库[20]。
2.2 寻找蛋白质家族保守序列 通过同源检索,寻找新基因中包含的该蛋白质家族的保守序列,为进一步深入研究其功能作好准备。多重序列同源比较,被用来寻找基因家族或蛋白质家族中的保守部分[21-22]。由于保守部分常常与家族成员的功能密切相关,蛋白质家族数据库能够帮助科学家更好地认识基因的功能。最具代表性的蛋白质家族保守序列的数据库有PRINTS、BLOCKS、Sbase 和Prosite等。这些数据库可以帮助我们把新基因所属的蛋白质家族及其保守部分找出来,并提供该家族其他成员的结构和功能信息[23]。
2.3 蛋白质结构的预测 如果一个可能的新基因通过同源检索后没有同源性,就成为孤独基因了。孤独基因可以通过结构同源比较,寻找结构同源的基因或直接预测其高级结构来推测其可能的功能。有很多蛋白质高级结构数据库提供结构同源比较的检索[20]。
目前,在后基因组时代,研究者们面对的不仅是序列和基因,也有越来越多的完整基因组。对不同种株包虫基因组之间的比较性研究很可能会得到大量有用信息,而对同一种包虫生活史不同阶段基因组的比较性研究可能会使人们对于该物种的认识更加深入。因此,随着生物信息学的迅速发展和后基因组计划的深入,包虫的基础研究必将得到极大地发展。人们能够期望从对基因和基因的生物学功能研究着手,发现更有效的抗包虫的药物靶位或疫苗[24-25],并为彻底揭开包虫的奥秘以及有效的治疗与预防包虫病打下基础。
参考文献
[1] 陈颖健.生物信息学[J]. 国外科技动态,2002,10(399):39-41.
[2] Ezio Bartocci,Flavio Corradini,Emanuela Merelli.BioWMS:a web-based Workflow Management System for bioinformatics[J]. BMC Bioinformatics,2007,8(Suppl 1):S2.
[3] Stephen H,Wefer Keith Sheppard.Bioinformatics in High School Biology Curricula:A Study of State Science Standards[J]. CBE-Life Sciences Education,2008,7:155-162.
[4] 冯毅.生物信息学在药物研发中的应用与展望[J].西部医学,2007,19(5):971-973
[5] 孙敏,马月辉.生物信息学研究进展[J].家畜生态学报,2006,27(1):6-10.
[6] 汪凡军.生物信息学在医学上的应用[J].国际检验医学杂志,2006,27(2):161-163.
[7] Yang Yong Mei.Application Development of Bioinformatics in Medicine Study[J]. Medical Recapitulate,2007,13(22):1681-1683.
[8] Michelle D,Brazas BF,Francis Ouellette.2008 update on the Bioinformatics Links Directory[J]. Nucl Acid Res,2008,36:W2-W4.
[9] Benson D,Karsch-Mizrachi I,Lipman D,et al.Gen-Bank:update[J]. Nucleic Acids Res,2004,6:23-26.
[10] Apweiler R,Bairoch A,Wu C,et al.UniProt:the Universal Protein knowledgebase[J]. Nucleic Acids Res,2004,6:115-119.
[11] International Human Genome Sequencing Consortium:Initial sequencing and analysis of the human genome[J]. Nature,2001,409:860-921.
[12] Pennisi E.The sequence of the human genome[J]. Science,2001,291:1173-1180.
[13] Collins F,Galas D.Human genome[J]. Science,1993,262(130):43-46.
[14] Alan F,Cowman Brendan S.Functional genomics:identifying drug targets for parasitic diseases[J]. Crabb Trends Parasitology,2003,19(11):538-543.
[15] Rick L,Tarleton Jessica Kissinger.Parasite genomics:current status and future prospects[J]. Current Opinion in Immunology,2001,13(4):395-402.
[16] David A,Johnston Mark L.Genomics and the biology of parasites[J]. BioEssays,2008,21(2):131-147
[17] Sara E,Melville Christiane,Neil Hall.Methods in Molecular Biology Parasite Genomics Protocols[M]. Humana Press,2004:
[18] Yvan Strahm,David Powell,Christophe Lefebvre.EST-PAC a web package for EST annotation and protein sequence prediction[J]. Source Code for Biology and Medicine,2006,(1):2
[19] Samuel Karlin.Statistical signals in bioinformatics[J]. PNAS,2005,102(38):13355-13362.
[20] Sebastien Ribrioux,Adrian Brüngger.Bioinformatics prediction of overlapping frameshifted translation products in mammalian transcripts[J]. BMC Genomics,2008,9:122.
[21] Catherine H,Schein Ovidiu Ivanciuc,Werner Braun. Bioinformatics Approaches to Classifying Allergens and Predicting Cross-Reactivity[J]. Immunol Allergy Clin North Am,2007,27(1):1-27.
[22] Chua Kek Heng,Rofina Yasmin Othman.Bioinformatics in molecular immunology laboratories demonstrated:Modeling an anti-CMV scFv antibody[J]. Bioinformation,2006,1(4):118-120.
[23] Omar J,Jabado Sean Conlan P. Comprehensive viral oligonucleotide probe design using conserved protein regions[J]. Nucl Acid Res,2008,36(1):10.
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- wisdomgame.cn 版权所有
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务