电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

机器学习实战

机器学习实战_第1页
1/23
机器学习实战_第2页
2/23
机器学习实战_第3页
3/23
机器学习实战(用 Scikit-learn 和TensorFlow 进行机器学习)一、简介Seikit-learn 集成了很多机器学习需要使用的函数,学习 Seikit-learn 能简洁、快速写出机器学习程序。并且通过代码更加深入的了解机器学习模型,学习如何处理数据,如何选择模型,如何选择和调整模型参数。二、配置必要的环境1、推荐安装 Anaconda(集成 Python 和很多有用的 Package)2、编辑器:Spyder 或 Pycharm 或 JupyterNotebook三、开始实战(处理 CSV 表格数据)1、下载数据数据集为房屋信息 housing,代码运行后,会下载一个 tgz 文件,然后用 tarfile 解压,解压后目录中会有一个 housing.scv 文件(可以自行用 exeel 打开看看),下载代码为:importosimporttarfilefromsix.movesimporturllibDOWNLOAD_ROOT=""https://raw.githubusercontent.com/ageron/handson—ml/master/""HOUSING_PATH=""datasets/housing"HOUSING_URL=DOWNLOAD_ROOT+HOUSING_PATH+"/housing・tgz""deffetch_housing_data(housing_url=HOUSING_URL,housing_path=HOUSING_PATH):ifnotos.path・isdir(housing_path):os.makedirs(housing_path)tgz_path=os.path・join(housing_path,""housing・tgz")urllib.request.urlretrieve(housing_url,tgz_path)housing_tgz=tarfile・open(tgz_path)housing_tgz・extractall(path 二 housing_path)housing_tgz・close()fetch_housing_data()2、读入数据通过 panda 库读取 csv 文件。importpandasaspddefload_housing_data(housing_path 二 HOUSING_PATH):csv_path=os.path・join(housing_path,""housing・csv")returnpd・read_csv(csv_path)housing=load_housing_data()3、观察数据载入数据以后,首先就是要观察数据是否成功导入,是否存在缺失值,是否存在异常值,数据的特征呈现何种分布等。head()输出前 5 个数据和表头head()可以查看数据是否成功导入,并可以查看数据包含哪些特征以及特征的形式大概是怎么样的。housing.head()输出结果In[7]:housing.head[)0ut[7]:'.ongitudelatitudehousing_Median_agetotal_roontstotal_bedroonisX0-122.2337.8841.0880.Q129.01-122.2237.3&21.07099.01105.02-122.2437.S552.014&7.0190.02-122.2537.S552.01274.0235.04-122.2537.8552.01627.0280.0populationlioiiseholdsmedianincomemedianhouse_valueocean_proxinity0S22.0126.0_8.3252-452600.0NEARBAY12401.01138.08.3014358500.0NE...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

机器学习实战

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部