检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome EdgeFirefox X

首页科技前沿与新兴产业竞争情报竞争情报

基于LDA-Louvain的期刊分类方法研究——以智慧农业领域为例(结论部分)

供稿人:苏惠京供稿时间:2024-07-18 10:23:54关键词:智慧农业,LDA,期刊分析

1、效果评估

下表是LDALouvainLDA-Louvain三种方法分类结果的对比数据。可以看出LDA主题分类覆盖100%文章,共10个主题。Louvain分类共有262个主题,数量占比前6的主题文章量为88.1%LDA-Louvain社区分类覆盖100%文章,共8个主题。主题连贯度指标来看,Louvain算法生成的6个主要分类的平均主题连贯度与LDA-Louvain生成的8个主题的平均主题连贯度一致。另外,对于期刊我们抽样了300条记录进行人工打标,人工打标集中度公式为在人工打标的分类中,不同算法分类占比最大那一类的占比值的平均值。

指标

LDA

Louvain

LDA-Louvain

分类结果

10个主题,覆盖100%文章

262个主题,前6个主题文章数量占88.1%

8个主题,覆盖100%文章

大分类覆盖率

100%

88.10%

100%

大类主题连贯度

/

0.36

0.36

人工打标集中度

44.1%

41.7%

50.6%

分类结果表明,仅使用Louvain算法存在很多离群的小社团(社团内节点数量小于5),而考虑LDA关系后的LDA-Louvain社区分类可以覆盖100%文章的分类。LDA-Louvain分类后的主题连贯度与Louvain6个大主题保持一致,并且在人工打标的集中度上表现更为优越。


在主题的六大分类中,相互之间的逻辑关系如上图所示。在每个分类中,列出了摘要分词和关键词频次前十的词汇。宏观战略、对策层面对农业人才的培养与发展具有指导促进作用。国务院印发的《“十三五”国家信息化规划通知》提出要推进农业信息基础设施智能化建设,推进农业信息化科技创新能力跨越,构建政产学研用紧密结合的农业信息化科技创新体系,有效支撑农业信息化产业发展。同时宏观战略层面需要加强对新型农业人才的培养,加大对农业相关人才的培养和储备力度,为智慧农业的发展提供足够的智力支撑[24]

智慧农机公司方面,雷沃、中联重科、中国一拖都是出现在关键词频次前10的企业。智慧农机装备通过依托前沿技术,实现无人化、精细化、智能化作业,可以减少农民耕作时间、提高农业作业效率、增加农民收益。

智慧农业利用物联网技术、传感器采集一系列农业相关数据,例如气象信息、土壤信息、病虫害信息、环境信息、作物图片信息、视频信息、农产品溯源信息等,这些数据不仅可以及时了解农作物的生长情况、周围环境情况,还可以给农产品建立“身份证”溯源制度,实现农产品的全程安全追溯。

借助北斗导航系统、4G5GRFID、蓝牙等技术,我们可以实现对采集的农业数据进行传输存储,搭建智慧农业平台,从而实现对农场进行更加精细化的运营管理。这些平台存储的气象信息、土壤信息、病虫害信息、环境信息、作物图片信息等数据,使得恶劣天气、病虫害预警、作物异常情况监测等任务能够得到更加及时的反馈与响应。另外,基于物联网技术采集的农产品溯源信息,可以完善农作物销售的电子商务系统,实现农业生产、物流与销售一体化的可信任流通平台。这样,农产品的来源和生产过程将得到更加透明的呈现,消费者能够更放心地购买农产品,同时也促进了农产品质量的提升与品牌建设。

利用大数据与算法模型可以对采集的农业数据进行智能化分析,从而为农作物生长提供合适的环境、为人员管理提供决策依据。这些智慧农业的实践数据不仅农民和农场有益,同时对智能农机公司与政策制定者来说也有重要的意义。智能农机公司可以通过分析用户在实际使用时遇到的问题和需求来改进优化现有的农机产品。对政策制定者来说,农业的实践数据可以让他们了解不同地区和农场的需求差异,从而可以制定更加具有针对性的政策。

2、结论与展望

在目前的大数据背景下,数字化、智慧化已经渗透到各个领域。智慧农业领域是我国农业农村现代化转型的必然趋势。本文以智慧农业领域为例,构建了LDA-Louvain模型,基于期刊文献的摘要与关键词字段进行了分类分析。通过评价指标与专家知识验证了算法的有效性。

基于题录信息文献分类很多是将摘要或者关键词作为同等信息源进行处理。本文根据摘要与关键词的特点分别采用了不同的两种方式进行分类分析,经过验证本文提出的LDA-Louvain算法可以进一步提高期刊分类的有效性。同时结合专家知识,对智慧农业领域的宏观战略、人才培养、产学研用结合与物联网大数据技术方面进行了解读。

本文研究仅使用的中文的农业期刊进行分析,数据源存在局限性。未来可以考虑融合英文期刊、专利文献、网页新闻等数据进行进一步的分类分析。同时,在分类分析过程中边的权重仅根据关键词重复次数与LDA分类结果进行调整,未来可以更加精细化地考虑不同词汇之前的权重差别,提升分类的准确度。