实例介绍
【实例简介】
【实例截图】
【核心代码】
#import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from sklearn.metrics import accuracy_score,log_loss from sklearn.neighbors import KNeighborsClassifier from sklearn.svm import SVC,LinearSVC,NuSVC from sklearn.tree import DecisionTreeClassifier from sklearn.ensemble import RandomForestClassifier,AdaBoostClassifier,GradientBoostingClassifier from sklearn.naive_bayes import GaussianNB from sklearn.discriminant_analysis import LinearDiscriminantAnalysis from sklearn.preprocessing import LabelEncoder train=pd.read_csv("train.csv") test=pd.read_csv("test.csv") def encode(train,test): le=LabelEncoder().fit(train.species) labels=le.transform(train.species) classes=list(le.classes_) test_ids=test.id train=train.drop(['species','id'],axis=1) test=test.drop(['id'],axis=1) return train,labels,test,test_ids,classes train, labels, test, test_ids, classes = encode(train, test) X_train, X_test = train.values[train.index], train.values[test.index] y_train, y_test = labels[train.index], labels[test.index] classifiers=[ KNeighborsClassifier(3), SVC(kernel="rbf",probability=True), NuSVC(probability=True), DecisionTreeClassifier(), RandomForestClassifier(), AdaBoostClassifier(), GradientBoostingClassifier(), GaussianNB(), ] log_cols=["Classifier","Accuracy","Log Loss"] log=pd.DataFrame(columns=log_cols) for clf in classifiers: clf.fit(X_train,y_train) name=clf.__class__.__name__ print ("="*30) print name print ('*****Results****') train_predictions=clf.predict(X_test) acc=accuracy_score(y_test,train_predictions) print ("Accuracy:{:.4%}".format(acc)) train_predictions=clf.predict_proba(X_test) ll=log_loss(y_test,train_predictions) print ("Log Loss:{}".format(ll)) log_entry = pd.DataFrame([[name, acc * 100, ll]], columns=log_cols) log = log.append(log_entry) print ("="*30) sns.set_color_codes("muted") sns.barplot(x='Accuracy', y='Classifier', data=log, color="b") plt.xlabel('Accuracy %') plt.title('Classifier performance comparison') plt.show() sns.set_color_codes("muted") sns.barplot(x='Log Loss', y='Classifier', data=log, color="g") plt.xlabel('Log Loss') plt.title('Classifier Log Loss') plt.show() favorite_clf = LinearDiscriminantAnalysis() favorite_clf.fit(X_train, y_train) test_predictions = favorite_clf.predict_proba(test) submission = pd.DataFrame(test_predictions, columns=classes) submission.insert(0, 'id', test_ids) submission.reset_index() submission.tail()
好例子网口号:伸出你的我的手 — 分享!
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论