说明:如果访问 GitHub 比较慢的话,可以关注我的知乎账号(Python-Jack),上面的“从零开始学Python”专栏(对应本项目前 20 天的内容)比较适合初学者,其他的专栏如“数据思维和统计思维”、“基于Python的数据分析”、“说走就走的AI之旅”等也在持续更新中 ...
物种注释的本质是与参考序列数据库进行比对,利用identity、score、coverage、e-value等多项指标,对比对结果进行综合打分,根据相应的注释算法进行最后判定的过程。因此,注释结果的全面性和准确性不仅与参考数据库的选择有关,注释算法的应用也是很重要的一环 ...
之前写过一个 keras 进行图像分类的教程,同时也便于自己使用,进行了开源。经过一段时间的学习,虽然已不再使用 keras 和 tensorflow 作为深度学习框架进行项目开发,但是 keras 的简洁性还是值得新手选择使用的。这里完善一下教程和代码。建议:框架只是工具 ...
从下载数据集,解压到scikit_learn_data文件夹下,加载数据,详见code注释。 因为我们只取了10000个词,即10000维feature,稀疏度还不算低。而实际上用TfidfVectorizer统计可得到上万维的feature,我统计的全部样本是13w多维,就是一个相当稀疏的矩阵了。 上面代码注释说TF ...