1. 引言
随着社会经济的蓬勃发展,家具产业作为制造业的关键领域面临着信息孤岛、供应链不透明等多重挑战。这些问题不仅对家具产业链的运营效率构成了影响,同时也成为创新和发展的制约因素。为了应对这一现状,研究者们日益关注采用先进的信息技术手段,致力于构建更为高效、智能的家具产业链。在这个背景下,本研究的目标是通过基于知识图谱的方法,重新塑造家具产业链,以提高信息处理速度和准确性,并推动资源的更加合理配置,从而促进家具产业链的创新发展。
2. 研究现状和内容
知识图谱的发展势头迅猛,已经成为高效整合大规模数据、支撑语义智能搜索和促进知识互联的基础。近年来,它在医疗、金融、农业等领域得到了广泛应用 [1] 。在领域知识图谱构建方法方面,研究者们提出了多种创新方法。以农业为例,许多学者提出了一种专注于实现精准施肥的时空多模态知识图谱构建方法 [2] 。另外,针对在线评论数据,李叶叶等人提出了基于多源异构数据挖掘的知识图谱构建方法 [3] 。在电力领域,蒲天骄等研究者通过结构化方式构建了电力系统中概念、实体、事件及其关系的知识图谱 [4] 。而在金融领域,基于领域语言模型的方法不仅提出了知识分类、抽取、融合等文本处理方式,还成功构建了金融产业知识图谱 [5] 。这些方法的提出不仅为各领域的知识图谱构建提供了新的思路,同时也展示了知识图谱在不同领域的广泛适用性。现有研究在知识图谱的构建和个性化应用方面已经取得了显著的进展。然而,就家具领域而言,目前尚未见到完备的知识图谱构建,大部分研究将领域知识图谱与产业链切割开来,未能有效地实现对家具产业链的系统性和整合性研究。因此,提出将知识图谱方法引入家具产业领域,结合互联网技术,以深入研究家具产业链的构建方法,为实现家具产业链的全面理解和高效管理提供新的途径。
3. 基于知识图谱的家具产业链构建技术流程
在家具领域,知识类型的多样性,既包括非结构化的数据,也包含半结构化的信息,具有强烈的时效性,同时服务于广泛的产业用户。为了更有效地利用家具产业链独特的特征属性,我们采用了人工获取方式,通过专家访谈和多源数据收集,获取了家具设计领域的多样知识数据。整个构建过程涵盖六个关键步骤,包括知识获取、本体定义、知识抽取、知识融合、知识储存和知识应用,同时结合专家访谈的见解,最终塑造了家具设计领域的知识图谱,详细的构建流程(见图1)。
在这一过程中,数据采集与清洗环节显得尤为关键。首先,我们以人工获取为主,通过专家访谈和多源数据收集,获取了原始的家具设计领域数据。在这一步骤中,确保数据的准确性和全面性至关重要,以确保建立的知识库具备代表性和广泛覆盖性。接着,进行了数据清洗,包括对非结构化和半结构化数据的处理,以保证数据的一致性和标准化。清洗过程涉及去除噪音和冗余数据,同时对数据进行格式化,以满足知识图谱的建模需求。
在知识抽取与融合方面,知识抽取采用了多种策略,将非结构化和半结构化的知识数据转化为结构化的知识节点,涵盖了实体、关系和属性的详细细分。这有助于更有效地组织和管理家具产的核心信息。至于知识融合,我们进行了概念层和本体层的融合,以确保知识的全面性和一致性。最终,通过按照三元组格式将结构化的知识节点存储在家具领域知识库中,最终构建成一个高度结构化和可查询的知识图谱,这一方法流程强调了在构建过程中对数据的精确采集和有效清洗的至关重要性,为更好地理解和应用家具产业链中的关键知识提供了有力的支持。
Figure 1. Technical process of furniture industry chain construction based on knowledge graph
图1. 基于知识图谱的家具产业链构建技术流程
在进行家具产业本体定义时,将家具品类作为本体概念进行了明确定义。鉴于同一概念存在多种表述术语,选择以2021年实施的《家具工业术语》 [6] 为分类依据进行知识抽取。这一选用不仅具备实用性,同时强调了科学性的重要性。与此同时,鉴于家具产业的广泛涵盖和行业责任的重要性,我们进行了以产业链为主轴的逻辑结构梳理,通过结合家具领域的国家标准、专业书籍以及专家访谈等多方面的信息,对家具产业链中的实体进行了分类梳理与分层规划,充分考虑了家具产业的广度和行业责任的重要性,以确保对家具产业链的全面理解,为深入的知识整合和系统性分析提供了坚实的基础。
4. 家具品类划分与产业链结构分层规划
4.1. 家具品类划分
在家具领域知识图谱的构建中,鉴于家具品类的广泛多样性以及各自独特的产业链特征,我们采用了品类划分的方法,以确保对家具领域知识的全面覆盖。这一策略的制定参考了基于数据可视化技术的家具市场分析 [7] 方法,并综合了杭州市家具协会专家的实际经验和意见。
Table 1. Functional classification of furniture (part)
表1. 家具功能品类划分(部分)
Table 2. Furniture property category classification (part)
表2. 家具属性品类划分(部分)
首先,运用形状分类法将家具品类初步划分为六大类,分别是柜类、床类、桌几类、坐具类、支架类和零部件类。这一初步分类基于家具的基本形状和主要功能,为后续的详细细分提供了基础框架。
其次,进一步采用“属性分类”和“功能分类”两种逻辑,对各个品类进行了深入的分层和详细细分。具体而言,关注家具的功能特性、材质组成、使用场景等多个方面,以更全面地把握每个品类的关键特征。详细的分类结果功能分类(见表1)与属性分类(见表2)。通过这样的精细分类逻辑,能够更准确地捕捉各个家具品类的特殊属性,为产业链知识图谱的构建提供了详实而有力的数据基础。
这种基于品类划分的方法不仅考虑到了家具在形状和功能上的多样性,还在细节上充分考虑了每个家具品类的特殊属性和市场差异。这有助于更全面、系统地理解和整合家具领域的知识,为未来的研究和决策提供更为深入的基础。
4.2. 家具产业链结构分层规划
通过对家具产业链的详细梳理和深入研究上游、中游和下游阶段,对各个实体进行细致的分层规划,了解到家具产业链的结构特征和运作机制,即家具产业链的结构特征显著多元,包括原材料采购、生产加工、设计创新以及市场销售等多个关键环节,其中各个阶段之间存在密切的相互关系和协同作用。原材料的品质和供应稳定性直接关系到最终产品的制造质量,而设计创新和市场销售策略对产品在市场中的推广和占有发挥着决定性的作用。因此,深入了解家具产业链的各个环节对于促进整个产业的协同发展至关重要。
在深度逻辑结构梳理和知识图谱构建的过程中,通过全面把握家具产业链的核心要素,形成一个详尽而系统的产业知识体系,从而进行家具产业链结构分层(见表3)。具体而言,在上游阶段,聚焦于原材料的获取、加工和生产,通过对不同种类材料的细致分类,如木材、金属、塑料等,确保生产的基础可靠。在中游阶段,深入研究结构、工艺、设计等实体,并将其详尽地分层规划。例如,可以通过深入探究家具的结构设计、制造工艺和创新设计等方面知识节点,以更深入地了解家具制造的技术要素。最后,对下游阶段的销售渠道和商品进行了详细分类,包括线上和线下渠道,以及不同家具商品的市场表现,涉及到家具类别、价格段等因素,为市场推广提供了智能决策的依据。
Table 3. Furniture industry knowledge map structure and category planning
表3. 家具产业知识图谱结构与品类规划
家具产业链知识图谱的构建具有系统性、全面性和智能性的优势。通过将各个环节纳入知识图谱,我们形成了一个细致的知识网络,使得各个阶段的信息相互关联,形成有机整体。这种系统性的分层规划和深度分析不仅使决策者更容易理解整个产业链的复杂结构,也为未来的家具产业优化和创新提供了更为有力的支持。
5. 基于知识图谱的家具产业链构建方法验证
基于以上通过知识图谱技术提出的家具产业链构建方法,以家具品类中坐具为例进行产业知识智能检索与展示验证。
5.1. 知识采集
在数据采集方面,通过人工与垂直搜索引擎系统相结合的方式,以行业报告、文献、书籍、网站、专家访谈为样本进行知识本体挖掘,通过机器学习与数据清洗技术获得结构化知识本体,同时进行知识本体深层次搜集与处理,共获得知识实体13.7万个。
5.1.1. 关键词梳理
通过提前设定的坐具关键词即按照坐具的细分品类2大维度与家具产业链结构分层9个维度,共11个维度,如“椅子”、“凳子”、“材质”、“工艺”等进行多源数据采集,目的是收集线上与线下多源冗余的多模态、多形式知识数据源,同时对各种文献、知识进行阅读,并理解本体含义,然后进行知识结构化转化,保存为统一的格式后存入数据库中。
5.1.2. 知识抽取与融合
在知识图谱构建过程中,进行知识结构化转化。此过程包括对从多源采集而来的知识信息进行整理和编排,使其符合预先设计好的三元组形式。这种形式一般包含主体、谓语和宾语,也是指将实体之间的关系、属性进行抽取,构成实体间关系、属性三元组案例(见表4),旨在清晰地表达知识之间的关联关系,共提取3种关系定义与96种属性定义,即包含关系、并列关系、呼应关系、材质属性、强度属性、性能属性等,这些共性关系与属性的定义使得知识图谱能够清晰地表达不同实体之间的关联关系,如包含关系的共性定义即是在三元组种,首实体可以表达为一个实体作为主体,另一个实体作为宾语,通过特定的谓语来表示包含关系,以坐具品类为例,<椅子,属于,坐具>,这样一个三元组就是通过包含关系形成的,<木材,材质,梨花木>是一个既有包含关系又有材质属性的三元组,<可加工性能,相关性能值,好>是一个表达加工性能值的属性关联关系,这样以此类推将所有结构化知识实体进行关系与属性关联关系的表达,形成系统化家具产业知识图谱,这样的结构化表达形式有助于后续数据库存储和知识图谱的构建,确保了知识的一致性和可管理性,为后续的分析和应用提供了可靠的数据基础。
Table 4. Main relationships and attributes among entities (part)
表4. 实体间主要关系、属性(部分)
5.2. 智能决策与全文检索
本研究旨在基于知识图谱构建家具产业链,形成家具产业链知识系统,以实现对家具产业链的精准、系统化知识获取。在此过程中,引入向量空间模型(Vector Space Model, VSM)作为智能决策系统的组成部分,以实现对家具产业链的智能化知识检索和获取。
首先,根据VSM的原理对多源知识进行向量表示,将家具产业链的各关键知识节点(如原材料、生产加工、设计创新等)抽象为向量,令
表示第i个实体节点,
表示第j个词项或关键节点,其中每个维度对应于特定的词项或关键节点;其次,采用TF-IDF (词频–逆文档频率)等权重计算方法,以准确反映节点的重要性,文档向量
表示
和
的权重,可以使用词频–逆文档频率(TF-IDF)等方法计算。
用户的查询也被表示为向量,具体的表示方式与家具产业链知识图谱话语体系保持一致,使用余弦相似度来计算智能决策的准确性,具体公式如下所示:
其中Q为查询向量,
为文档i的向量。
通过VSM的应用,实现了对家具产业链的智能化知识检索和获取,对于给定的查询,计算其与各个文档的相似度,排序后返回相似度较高的文档,即相关的家具产业链知识节点。这一基于相似度的检索方法不仅提高了检索效率,同时为系统准确捕捉相关知识节点提供了强有力的支持,展示了坐具产业链中游产业的知识节点(见图2),这一系统化的展示有助于家具产业用户深入了解上中下游关联知识节点,推动了个家具产业链向智能化和系统化方向迈进。
Figure 2. Knowledge map of furniture industry chain (seated part)
图2. 家具产业链知识图谱(坐具部分展示)
6. 结语
本文基于知识图谱技术,研究了构建家具产业链知识图谱的方法。该方法首先基于知识图谱构建技术搭建了家具产业链知识图谱构建技术流程;其次对家具产业链结构进行分层规划与品类划分,同时引入VSM空间向量模型,通过智能决策系统实现了家具产业链知识关联与系统性呈现;最后通过坐具这一具体品类案例进行了该方法的有效性验证,并详细展示了家具产业链知识实体之间的关系与属性。在未来研究中,可以考虑对多模态家具产业知识的获取与展示,针对各个品类知识节点进行细化和调整,从而提高实用性,另外,还可以进一步探索如何针对不同的产业用户获取个性化的知识节点,以此来提高家具领域的产业链质量。
基金项目
浙江省科学技术厅“领雁”研发攻关计划项目(2022C01220);浙江省高等教育“十四五”教学改革项目-jg20220192。