数据的可视化表达VIP免费

下载本文档

阅读 182
下载 25
格式 pptx
大小 23.66 MB
约23页
2024-10-20 发布于江苏
收藏
评论
点赞(0)
海报
举报

1/23页

2/23页

3/23页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/23

文本预览下载提示常见问题

5.4数据的可视化表达1.了解数据可视化的两种类型；2.学会选用恰当的工具可视化表达数据，揭示数据反映的本质问题，提升数据分析的效率。学习目标知识结构图数据的特征探索系统日志采集法网络数据采集法（网络爬虫）其他数据采集法阅读《数据与计算》P118-1225.4.1数据可视化表达的方式1.快速抓住要点信息2.有效提升数据分析的效率。3.生动形象的呈现方式便于理解数据。5.4.1数据可视化表达的方式优点：5.4.1数据可视化表达的方式呈现类型探索解释趋势比例逻辑关系空间关系在matplotlib的基础上进行更高级的API封装是matplotlib的补充能高度兼容numpy与pandas数据结构能高度兼容scipy与statsmodels等统计模式。SeabornBokeh统计模型的可视化实现交互式可视化基于并高度依赖于Matplotlib独立于Matplotlib5.4.2数据可视化表达的工具1.Seaborn——基于并高度依赖于Matplotlib2.Bokeh——独立于MatplotlibSeabornBokeh统计模型的可视化实现交互式可视化基于并高度依赖于Matplotlib独立于Matplotlib5.4.2数据可视化表达的工具Bokeh绘图步骤①获取数据②构建画布figure()③添加图层，绘图line，circle，square，scatter，multiline等；参数color，legend④自定义视觉属性⑤选择性展示折线数据，建立复选框激活显示，复选框(checkbox)在概率论中用来估计未知的密度函数，属于非参数检验方法之一核密度估计方法不利用有关数据分布的先验知识对数据分布不附加任何假定是一种从数据样本本身出发研究数据分布特征的方法5.4.2数据可视化表达的工具【项目练习】运行“程序5-10-1直方图（教材范例）.py”，体验可视化工具Seaborn呈现直方图。核密度估计5.4.2数据可视化表达的工具【项目练习】运行“程序5-10-1直方图（教材范例）.py”，体验可视化工具Seaborn呈现直方图。5.4.2数据可视化表达的工具【项目练习】运行“程序5-10-2Bokeh示例（教材范例）.py”，体验可视化工具Bokeh呈现正弦图。5.4.1词云图可视化非结构化数据——文本【项目练习】运行“程序5-9-1词云图（教材范例）.py”，尝试修改词云图的文本文件内容和图片形状，体验词云图可视化呈现分析结果。1.图片形状：生成的词云是以背景照片的形状为模板遇到非白色的像素才会显示出来词云图5.4.1词云图【项目练习】运行“程序5-9-1词云图（教材范例）.py”，尝试修改词云图的文本文件内容和图片形状，体验词云图可视化呈现分析结果。1.图片形状：生成的词云是以背景照片的形状为模板遇到非白色的像素才会显示出来词云图5.4.1词云图【项目练习】运行“程序5-9-1词云图（教材范例）.py”，尝试修改词云图的文本文件内容和图片形状，体验词云图可视化呈现分析结果。2.文本文件格式：UTF8编码格式。5.4.1词云图importjiebaimportnumpyasnpfromPILimportImagefromwordcloudimportWordCloudaswdcimportmatplotlib.pyplotaspltpic_mask=np.array(Image.open("ty.jpg"))#获取词云形状的图片text=open(r'test.txt',encoding='utf8')#获取分词数据mylist=list(text)word_list=["".join(jieba.cut(sentence))forsentenceinmylist]new_text=''.join(word_list)wc=wdc(font_path='simhei.ttf',background_color="white",#显示的字体和背景颜色max_words=500,#出现次数最多的前500个分词max_font_size=150,#显示的最大字号random_state=40,#分词颜色的随机配色方案数量mask=pic_mask)#词云形状w=wc.generate(new_text)#传入分词列表plt.imshow(w)#绘制词云图plt.axis("off")#关闭坐标plt.show()#显示词云图中文词云5.4.1词云图fromwordcloudimportWordCloud#导入词云的包importnumpyasnpfromPILimportImageimportmatplotlib.pyplotasplt#导入matplotlib作图的包pic_mask=np.array(Image.open("ty.jpg"))#获取词云形状的图片#读取文件,返回一个字符串，使用utf-8编码方式读取，该文档位于此python同一级目录下new_word=open(u'english.txt','r',encoding='utf-8').read()#生成一个词云对象wordcloud=WordCloud(font_path='simhei.ttf',background_color="white",#显示的字体和背景颜色max_words=500,#出现次数最多的前500个分词m...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

数据的可视化表达

4数据的可视化表达1

了解数据可视化的两种类型；2

学会选用恰当的工具可视化表达数据，揭示数据反映的本质问题，提升数据分析的效率

学习目标知识结构图数据的特征探索系统日志采集法网络数据采集法（网络爬虫）其他数据采集法阅读《数据与计算》P118-1225

1数据可视化表达的方式1

快速抓住要点信息2

有效提升数据分析的效率

生动形象的呈现方式便于理解数据

1数据可视化表达的方式优点：5

1数据可视化表达的方式呈现类型探索解释趋势比例逻辑关系空间关系在matplotlib的基础上进行更高级的API封装是matplotlib的补充能高度兼容numpy与pandas数据结构能高度兼容scipy与statsmodels等统计模式

SeabornBokeh统计模型的可视化实现交互式可视化基于并高度依赖于Matplotlib独立于Matplotlib5

2数据可视化表达的工具1

Seaborn——基于并高度依赖于Matplotlib2

Bokeh——独立于MatplotlibSeabornBokeh统计模型的可视化实现交互式可视化基于并高度依赖于Matplotlib独立于Matplotlib5

2数据可视化表达的工具Bokeh绘图步骤①获取数据②构建画布figure()③添加图层，绘图line，circle，square，scatter，multiline等；参数color，legend④自定义视觉属性⑤选择性展示折线数据，建立复选框激活显示，复选框(checkbox)在概率论中用来估计未知的密度函数，属于非参数检验方法之一核密度估计方法不利用有关数据分布的先验知识对数据分布不附加任何假定是一种从数据样本本身出发研究数据分布特征的方法5

2数据可视化表达的工具【项目练习】运行“程序5-10-1直方图（教材范例）

py”，体验可视

读万卷书 + 关注: 实名认证
内容提供者

各类经典PPT文档分享

收藏店铺进入空间

数据的可视化表达VIP免费

数据的可视化表达

您可能关注的文档

相关文档

热门下载

相关标签