基于机器学习的抖音短视频用户分析 User analysis of douyin short video based on machine learning 内容摘要随着社会的发展。抖音短视频 APP 的碎片化时间娱乐,进行抖音短视频 APP 的用户数据分析,有利于不同用户的选择以及创作者的内容创作。针对短视频用户分析是建立在抖音 App 上的用户评论数据分析,进行抖音用户数据的爬虫,然后进行数据的分析。基于抖音短视频 App的用户分析,使用机器学习的情感分析算法进行用户数据的区分以及分析。在本次研究中,情感分析算法使用贝叶斯模型进行语句的情感分析预测。使用 jieba 分词系统用于对视频内容进行分类区分。使用机器学习算法中的 snownlp 库进行中文语句的判断预测,snownlp 库可以为中文语句的情绪判断进行预测。当判断返回值越接近 1 的时候,表示为正面情绪,越接近 0 的时候表示负面情绪。在本研究中,采取了百度 AI 情感分析以及本研究使用的基于贝叶斯模型的 snownlp 库情感分析的对比数据测试,从数据样本中随机抽取1000 条数据进行准确度测试。经过测试分析,本研究使用的情感分析算法与百度 AI 得出的情感分析的准确率达到 85%。通过数据测试,证明本研究所使用的情感分析算法准确率可以得到有效的保证以及可信度。关键词:数据分析; 机器学习算法; 数据爬虫; 分词 AbstractWith the development of society. The fragmented time entertAInment of Douyin Short Video APP, user data analysis of Douyin Short Video APP is beneficial to the choice of different users and the content creation of creators.The analysis of short video users is based on the analysis of user comment data on the Douyin App, crawling the user data of Douyin, and then analyzing the data. Based on user analysis of Douyin Short Video App, machine learning sentiment analysis algorithm is used to distinguish and analyze user data.In this study, the sentiment analysis algorithm uses Bayesian models to predict sentiment analysis of sentences. Use jieba word segmentation system to classify video content. Use the snownlp library in the machine learning algorithm to judge and...