zoukankan      html  css  js  c++  java
  • 文本分类之六分类结果评估

    机器学习领域的算法评估有三个基本的指标。

    1. 召回率(Recall Rate,也叫查全率):是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。
      召回率=系统检索到的相关文档数/系统所有相关文档的总数
    2. 准确率(Precision,也称为精度):是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率。
      准确率=系统检索到的相关文件/系统所有检索到的文件总数

    注意:准确率和召回率是互相影响的,理想情况下肯定是做到二者都高,但是一般情况下,准确率高,召回率就低;反之亦然。

    1. F-Score:机器学习中常用的评价标准。其中,最常见的是F1-Measure,公式为:F1=2PR/(P+R)
      文本分类项目的分类结果评估,代码如下:
    from sklearn import metrice
    def metrics_result(actual, predict):  
        print '精度:{0:.3f}'.format(metrics.precision_score(actual, predict,average='weighted'))  
        print '召回:{0:0.3f}'.format(metrics.recall_score(actual, predict,average='weighted'))  
        print 'f1-score:{0:.3f}'.format(metrics.f1_score(actual, predict,average='weighted'))  
      
    metrics_result(test_set.label, predicted) 
    

    注意:单独运行这个代码会报错,把这一部分加到贝叶斯模型的程序中运行,就可以得到正确的结果。

  • 相关阅读:
    使用Linq to Sqlite 出现异常Object already attached
    CSS 嵌套DIV布局
    《面试笔记》——MySQL终结篇(30问与答)
    PotPlayer播放器下载
    博客圆的RSS怎么不能用呢
    OPC在自控系统的应用
    TAPI的使用
    刷iPAQ为Linux(zz HiPDA)
    再论软工
    Silverlight的大小自适应中存在的一个问题
  • 原文地址:https://www.cnblogs.com/sanmenyi/p/7040400.html
Copyright © 2011-2022 走看看