生物信息学中的数据挖掘方法及应用

出版时间:2011-11  出版社:科学出版社  作者:梁艳春 等著  页数:216  
Tag标签:无  

内容概要

  本书针对生物信息学领域的一些前沿课题,以数据挖掘算法为中心,系统地介绍了机器学习、统计学习及多种智能算法在生物信息学相关领域的应用,为生物信息学方向的初学者提供了入门知识,也为相关研究人员在特定方向深入研究提供了参考信息。主要内容包括操纵子预测、原核生物系统发生树的构建、基于数据扰动的误标记样本检测、差异表达基因识别以及基因表达数据的特征选择等。
  本书可以作为高年级本科生或研究生的生物信息学课程教材,也可供相关研究领域生命科学工作者和计算机应用人员参考。

书籍目录

前言
第1章绪论
1.1什么是生物信息学
1.2生物信息学的研究对象
1.2.1基因组数据
1.2.2蛋白质组数据
1.2.3基因表达数据
1.3生物信息学的研究领域
1.4生物信息学的进展和存在的问题
1.4.1生物信息学的进展
1.4.2生物信息学存在的问题
参考文献
第2章操纵子预测
2.1操纵子预测的研究背景及现状
2.1.1操纵子简介
2.1.2操纵子预测的研究现状
2.2操纵子预测的相关数据
2.2.1基因间距离
2.2.2 cog功能分类
2.2.3保守基因对(蔟)
2.2.4系统进化谱
2.2.5基因本体
2.2.6kegg同源
2.2.7同义密码子使用偏好性
2.2.8其他属性信息
2.2.9基因组和已知操纵子数据
2.3操纵子预测的相关基础
2.3.1预测问题定义
2.3.2预测数据预处理
2.3.3预测效果评价
2.4基于神经网络的操纵子预测模型
2.4.1模型的具体流程
2.4.2模型的实验验证
2.5基于图聚类方法的操纵子预测模型
2.5.1模型预测流程概括
2.5.2模型预测的具体流程
2.5.3模型的实验验证
2.6小结
参考文献
第3章原核生物系统发生树的构建
3.1系统发生树构建的研究背景及现状
3.1.1系统发生树简介
3.1.2原核生物系统发生树构建的研究现状
3.2系统发生树构建的相关数据和基础
3.2.1原核生物基因组数据
3.2.2已知系统进化树数据
3.2.3直系同源信息
3.2.4水平转移基因信息
3.2.5操纵子信息
3.2.6构建问题定义
3.2.7结果性能估计
3.3基于连续直系同源基因的系统发生树构建方法
3.3.1方法描述
3.3.2方法的具体流程
3.3.3方法的实验验证
3.4基于全基因组序列和注释信息的系统发生树构建方法
3.4.1方法描述
3.4.2方法具体流程
3.4.3方法的实验验证
3.5小结
参考文献
第4章基于数据扰动的误标记样本检测
4.1误标记样本检测的研究背景及现状
4.2基于loopc矩阵的误标记样本检测方法
4.2.1loopc矩阵
4.2.2 cl-stability方法
4.2.3looe-sensitivity方法
4.3基于扰动影响值的误标记样本检测方法
4.3.1扰动影响值
4.3.2基于扰动影响值的列算法
4.3.3基于扰动影响值的行算法
4.3.4行算法中的阈值调整策略
4.3.5.渐进修正的行算法
4.4误标记样本检测方法的比较分析
4.4.1测试数据集说明
4.4.2测试指标说明
4.4.3实验结果分析
4.5小结
参考文献
第5章基因表达数据中的差异表达基因识别
5.1差异表达基因的研究背景及现状
5.2t-test假设检验方法
5.3sam方法
5.4 rankprod方法
5.5基于总体数据集变化量评估的检测方法
5.5.1基因的表达变化量
5.5.2总体数据集变化量评估
5.5.3总体数据集评估方法的效果分析
5.6小结
参考文献
第6章基于微阵列数据的特征选择
6.1特征选择算法的研究背景及现状
6.1.1特征选择在基因芯片中的应用
6.1.2基于微阵列数据的特征选择算法的研究现状
6.2特征选择算法研究的相关基础
6.2.1支持向量机(svm)
6.2.2支持向量机递归特征剔除(svm-rfe)
6.2.3改进的支持向量聚类算法(svc-km)
6.2.4局部支持向量机(lla)
6.3多阶段特征选择算法
6.3.1算法描述
6.3.2算法流程
6.3.3算法的实验验证
6.4双向局部化特征选择算法
6.4.1算法描述
6.4.2算法流程
6.4.3算法的实验验证
6.5基于改进遗传算法的特征选择方法
6.5.1算法描述
6.5.2算法过程概括
6.5.3算法流程
6.5.4算法效果的实验分析
6.6小结
参考文献
第7章改进的双聚类算法在癌症基因芯片数据中的应用
7.1基因芯片数据聚类算法简介
7.1.1传统聚类算法概述
7.1.2常用的传统聚类算法及其特点
7.1.3传统聚类存在的不足
7.1.4双聚类算法分类及其特点
7.1.5cheng-church算法
7.2改进的cheng-church算法及模拟数据分析
7.2.1cheng-church算法的优缺点
7.2.2 cheng-church算法的改进
7.2.3模拟数据分析
7.3癌症基因芯片数据的双聚类分析
7.3.1癌症基因芯片数据分析的意义
7.3.2实验数据来源
7.3.3特征基因的选择
7.3.4双聚类分析
7.4小结
参考文献

图书封面

图书标签Tags

评论、评分、阅读与下载


    生物信息学中的数据挖掘方法及应用 PDF格式下载


用户评论 (总计11条)

 
 

  •   对初学生物信息学的读者来讲,是本非常不错的书!
  •   很好的数据挖掘方面的指点。挺好
  •   书很好,值得学习。
  •   不够浅显,内容太深。
  •   原理讲得有点多,不太好懂...
  •   深入浅出值得称赞
  •   简单实用,适合初学
  •   有点基础的人看比较合适
  •   学习一些挖掘方法。处理DNA的知识···
  •   书的内容太简单了
  •   读起来很舒服。书本质量也很好。
 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7