托寄物智能识别——大模型在京东快递物流场景中的应用与落地

一、前言

在现代物流场景中，包裹信息的准确性和处理效率至关重要。当前，京东快递在邮寄场景中面临着日益丰富的寄递品类和多样化的个性化需求。本文将深入探讨托寄物智能识别——大模型在京东快递物流场景中的应用与落地，分析其产生背景、应用效果及未来发展方向。

二、背景

随着电子商务的迅猛发展，物流行业面临着前所未有的挑战和机遇^[1]。尤其是在中国，作为全球最大的电子商务市场之一，物流行业的效率、准确性和智能化成为各大电商平台竞争的关键因素。

当前，京东快递在邮寄场景中面临着日益丰富的寄递品类和多样化的个性化需求。消费者对寄递服务的期望不断提升，他们希望能够享受到更加快速、可靠和个性化的物流服务。这种需求的多样化给物流企业带来了巨大的压力，但同时也提供了提升服务质量和客户满意度的机会^[2]。与此同时，京东快递内部运营也面临着高破损率和高理赔成本的问题。详细分析后发现，理赔和破损问题主要集中在3C产品和生鲜品类。这些高价值和高时效的品类对托寄物的精准识别提出了更高的要求。3C产品通常价格昂贵且易损坏，而生鲜品类则对运输时效和温控要求极高，任何延误或处理不当都可能导致严重的损失。这些高价值和高时效的品类对托寄物的精准识别提出了更高的要求。核心体现在以下几个方面：

1. 揽收要求

(1) 航空违禁品识别：通过精确匹配托寄物信息，减少人工判断的误差，提高航空违禁品的识别准确性。

(2) 包装推荐：

① 实时包装推荐：在下单和揽收时实时推荐合适的包装，减少破损风险。

② 包装预测：基于历史客户的下单习惯和需求，提前为每个站点推荐所需的包装材料。

(3) 生鲜品类免赔：针对超标准时效要求的寄递需求，通过签署免赔协议允许寄递，降低理赔成本。

2. 运营保障

针对高价值和高时效的品类（如大闸蟹、樱桃、草莓、牛羊肉等），需要在揽收、转运、派送、客户服务和理赔全流程中提供保障和提效措施，提升京东物流的产品竞争力。

综上所述，传统的包裹信息处理方式往往依赖人工操作，不仅效率低下，还容易出错。随着人工智能和自然语言处理技术的迅猛发展，如何利用这些技术提升包裹信息处理的智能化水平，成为了一个重要课题。这不仅可以显著提高处理效率，还能减少错误率，优化整体运营流程，提升客户满意度和企业竞争力。

三、托寄物智能识别的产生

在目前的京东快递邮寄场景中，用户需要输入托寄物名称，系统会根据输入的名称匹配设定的品类，并基于托寄物的品类建立相应的业务规则和优化下单逻辑，如何提升托寄物匹配率，是我们研究的课题。首先我们需要分析匹配率现状及原因

成功识别到品类的运单：通过某种手段成功识别托寄物属于哪种品类，举例说明：托寄物为“阳澄湖大螃蟹”的品类为海鲜或者螃蟹

识别结果成功匹配品类库：对成功识别到的托寄物品类能够匹配现有品类库中的三级品类，例如：“阳澄湖大闸蟹”识别结果是螃蟹，对应品类库三级品类为：生鲜-海鲜-螃蟹

3.1 托寄物智能识别匹配率现状及原因分析

根据2023年给出的历史数据可以看到，运单托寄物匹配率相对较低，具体分析低匹配率的主要原因有以下几个点：

(1) 品类库不完善：当京东快递与快手、拼多多、抖音等多种电商平台对接后，这些平台上的商品种类繁多且更新频繁，当前品类库的不足之处在于不能全面覆盖所有商品类别，导致在实际应用中可能出现识别错误或遗漏的情况。因此，品类库有待进一步完善，以提高系统的识别准确性和全面性。

(2) 用户输入的多样性：用户在输入托寄物名称时，往往会使用各种各样的描述方式，这些描述方式可能包含错别字、方言、缩写或是个性化的命名方式。这种多样性给系统带来了极大的挑战，使得系统难以准确匹配用户输入的托寄物名称。例如，同一种商品可能会有多种不同的称呼，或者用户可能会使用模糊或不标准的名称来描述物品，导致系统无法识别或匹配错误。因此，系统需要具备更强的自然语言处理能力和更丰富的语义理解能力，以应对用户输入的多样性。

(3) B端商家的商品名称干扰：B端商家在使用零售平台的商品名称作为托寄物名称时，往往会在名称中加入大量用于营销或SEO优化的关键词和描述信息。这些信息虽然有助于商品在平台上的曝光和搜索排名，但却给托寄物识别系统带来了干扰。例如，商品名称中可能会包含促销信息、规格参数、品牌名等非必要信息，影响了系统对商品本身的准确识别和匹配。因此，需要对这些干扰信息进行有效过滤和处理，以提高系统的匹配准确性和识别效果。通过优化算法和改进数据处理流程，可以更好地应对B端商家商品名称中的干扰信息，提升系统的整体性能。

3.2 托寄物匹配率低的影响

托寄物匹配率低会对物流和快递业务产生多方面的负面影响，包括无法准确分析和预测托寄物特性及流通趋势，导致业务规划和营销策略不够精准；在生鲜业务中，匹配错误可能引发产品变质、客户投诉和理赔问题，增加运营成本；同时，增值服务推荐不准确会影响快递员的揽收效率和客户满意度，进而削弱整体服务质量和公司的市场竞争力。因此，提高识别匹配率对于优化运营流程、提升客户体验和增强企业竞争力至关重要。具体影响归纳如下：

(1) 生鲜业务问题：在处理生鲜寄递业务时，由于系统未能准确识别生鲜或者易碎匹配产品，常常导致客户投诉和理赔问题。生鲜产品对时效性和温控要求极高，一旦匹配错误，可能导致配送延误或温控失效，进而引发产品变质。这不仅损害了客户体验，还增加了公司的运营成本和赔偿风险。例如，某些生鲜产品需要特殊的包装和运输条件，如果系统无法识别并匹配这些需求，可能导致运输过程中的损坏和质量问题。因此，提升生鲜产品的识别准确性和匹配能力，是减少客户投诉和理赔问题的关键。

(2) 增值服务推荐不准确：如果托寄物品类识别不准确，会造成基于托寄物的增值服务推荐不够精准，可能会影响快递员上门揽收的效率。例如，对于某些高价值或易碎物品，系统应推荐保险服务或特殊包装服务，但由于识别不准确，可能未能及时提供这些建议，导致客户体验不佳和潜在的风险增加。此外，增值服务推荐不准确也可能造成快递员在揽收过程中需要额外沟通和确认，降低了整体揽收效率。

(3) 缺乏底层数据：由于整体识别匹配率较低，导致缺乏全面和准确的底层数据，系统无法对托寄物进行深入的分析。这种数据缺失限制了对托寄物特征、流通路径、用户偏好等方面的洞察，进而影响了业务决策和营销策略的制定。例如，无法准确掌握某类托寄物的高峰期和低谷期，导致库存管理和配送资源的调配不够优化。此外，缺乏底层数据也使得难以进行精准的市场细分和个性化营销，无法有效提升客户满意度和忠诚度。因此，建立完善的底层数据采集和分析体系，对于提升业务规划和营销策略的科学性和有效性至关重要。

基于以上原因和影响，京东快递亟需一种更智能的托寄物识别系统，以提高匹配率和服务质量，提升客户体验和增强企业竞争力。

3.3 大模型赋能托寄物智能识别

自BERT（Bidirectional Encoder Representations from Transformers）和GPT系列模型的成功之后，我们就关注到大模型的发展能为快递行业的快速发展助力赋能。在进行托寄物智能识别时，选择合适的大模型是一个关键的决策，这将直接影响到识别的准确性、效率以及系统的可扩展性。

3.3.1选择什么样的大模型？

以下是在选择大模型时需要考虑的几个关键因素：

(1) 模型性能与准确性：首先，模型在托寄物识别任务上的性能和准确性是最重要的考量点。这包括模型对各类托寄物的识别能力，以及在不同条件下的稳定性。

(2) 处理速度与实时性：在快递行业中，处理速度至关重要，因此模型的推理速度（即完成识别所需的时间）是一个重要的考虑因素。理想的模型应能够在保证准确性的同时，实现快速的识别，满足实时处理的需求。

(3) 资源消耗：大模型通常需要较多的计算资源，包括CPU/GPU计算能力和内存。因此，模型的资源消耗情况也是一个需要考虑的因素，特别是在资源有限的环境下。

(4) 易用性与集成：模型的易用性，包括其在现有系统中的集成难易度，以及后续的维护和升级需求，也是重要的考虑点。一个好的模型不仅应该在技术上表现优秀，还应该容易被集成到公司业务的现有工作流程中。

(5) 可扩展性与灵活性：随着快递行业的发展和业务需求的变化，模型可能需要处理更多类型的托寄物或适应新的识别场景。因此，模型的可扩展性和灵活性也是选择时需要考虑的因素。

(6) 安全性与隐私：在处理客户托寄物的信息时，模型需要确保数据的安全性和客户隐私的保护。这包括数据加密、访问控制等安全特性。

结合以上因素，我们评估到当托寄物名称识别为物品类型时，暂不涉及用户隐私等安全信息问题，同时，基于识别效果和成本考虑，在当前环境下的最优解，我们最终选择了最适合我们的大模型，该大模型的自然语言处理技术已经能够满足我们以上诉求。

自然语言处理（Natural Language Processing，简称NLP）是人工智能的一个关键领域，致力于让计算机理解、解释和生成自然语言，通过大规模预训练模型，实现文本生成、情感分析、机器翻译、问答系统等多种应用^[3]。虽然其强大的上下文理解、多语言处理和知识丰富等优势显著提升了人机交互的智能化水平，但也面临计算资源需求高、数据隐私和安全问题、解释性不足以及偏见和公平性等挑战^[4]。

3.3.2 大模型在托寄物识别中的应用

托寄物智能识别是基于自然语言处理技术的智能系统，旨在自动识别、处理和管理包裹信息^[5]。通过对包裹标签、物流单据等信息的智能解析，能够大幅提升包裹信息处理的效率和准确性，减少人工操作的工作量，并降低出错率^[6]。

京东快递借助大模型的强大能力，通过对文本信息的精准解析，实现了托寄物的高效识别和匹配。具体来说，大模型根据实现预设的业务规则能够理解并处理用户和商家输入的复杂描述，自动提取出关键特征，从而将托寄物精准匹配到正确的品类。这一过程不仅提高了识别的准确性，还大幅减少了因匹配错误导致的物流问题。以下是对大模型能力与现有能力对比情况：

大模型在文本解析方面的应用，使得托寄物能够被精准识别并匹配到正确的品类。通过对现有品类的深入分析和理解，大模型能够提出更准确的命名，并自动生成新的品类名称，确保品类库的不断更新和丰富。这种动态扩展的能力，使得品类库能够及时涵盖新兴商品和细分市场，提升了整体匹配的精度和效率。此外，通过更精准的托寄物品智能识别打标，系统能够推荐更符合托寄物品类的运输路线和时效。比如，对于易碎品和生鲜商品，系统会自动选择更适合的运输方式和更快的配送时效，确保商品的安全和新鲜度。这种精准的路线和时效推荐，不仅提高了物流运营的效率，还显著减少了客户投诉，挽回了因运输问题导致的托寄物理赔损失。

通过对托寄物品类型数据的深入分析，京东快递能够推荐更合理的增值服务，从而提升揽收效率。例如，通过分析某一区域内的托寄物品类型和数量，系统可以预测未来的揽收需求，并提前安排快递员进行高效的揽收操作。此外，系统还可以根据托寄物的特性，推荐相关的增值服务，如保价服务、特殊包装服务等，进一步提高客户满意度和揽收效率。

从长远规划来看，京东快递还可以利用大模型对同类型托寄物邮寄较多的地区进行重新规划邮寄路线。通过对历史数据的分析，系统能够识别出某些地区对特定类型托寄物的需求较高，从而优化这些地区的邮寄路线，提高邮寄时效。例如，对于某些地区频繁邮寄的电子产品，系统可以规划专门的运输路线，以确保这些产品能够更快速地送达目的地。这不仅提高了用户体验，减少了客户投诉，还进一步提升了整体物流运营的效率。

四、托寄物智能识别的具体实施落地

如何有效的将大模型与我们的业务结合起来？如何控制成本？如何保证安全可控？如何高效率协作？这些都是我们面临的难题。

京东快递业务是面向C和B的业务，包括寄件、下单、查件等多个核心流程。其中托寄物信息识别是其核心流程下单环节中重要的一环。我们需要考虑以下几点：

(1) 在进行大模型查询识别过程中，我们要保证识别时效，不能影响下单效率。

(2) 京东快递业务量较大，如果每一单都进行大模型识别，使用成本较高，业务成本无法把控。

(3) 我们还要验证大模型识别结果的准确性是否满足诉求。

(4) 对于识别的结果无法匹配怎么处理？

4.1 架构设计

京东快递业务TOB和TOC特点不同，TOC大部分是用户输入，一般用户最多只输入几个字，用户更倾向使用热门推荐或者用户常寄列表中的记录，这类托寄物名称大概率即为品类名称，例如“文件”“衣服”等，这类词大部分都能在品类库中通过全匹配的形式匹配上。如下图所示：

而TOB大部分是商家，托寄物名称一般是电商平台的商品名称，夹带各种SEO搜索关键字和吸引眼球的描述信息，一般词条较长肉眼难以快速辨认，一般无法通过简单匹配的方式在品类库找到对应的三级品类，这类运单往往需要AI帮助识别出合适的类别，然后再进行品类库对应寻找。

针对以上TOB和TOC的不同特点，我们对托寄物智能识别系统设计了两种形式不同的架构。

4.1.1 B端架构设计

TOB流程：

① 托寄物描述信息：客户端将真实的B运单商品信息推送给品类推荐服务器进行处理，商品名称举例：“宁夏农垦滩羊无脊羊排5斤，宁夏农垦滩羊无脊羊排5斤，宁夏农滩羊无脊羊排5斤，宁夏农滩羊无脊羊排5斤，宁夏羊排”

② 品类推荐服务器经过处理后给大模型输入预处理后的托寄物描述，预处理后的托寄物描述可参考如下模式：您的任务是根据#物品描述#提取出x个字内的物品的品类和名称，只返回最明确且能体现用户意图的那个。忽略地域，品牌，型号，重量，体积，尺寸，数量，价格，包装，形容词等干扰信息。输出JSON对象:<包含以下键：品类和名称>,如果无法提取或确认，则键值为空，其中物品描述替换为#宁夏农垦滩羊无脊羊排5斤，宁夏农垦滩羊无脊羊排5斤，宁夏农滩羊无脊羊排5斤，宁夏农滩羊无脊羊排5斤，宁夏羊排#

③ 大模型根据输入的要求推理得到识别结果，#品类：肉，名称：羊排#

④ 识别结果与现有的品类库进行匹配，如果匹配上则将相应的品类返回给品类推荐服务器，如果匹配不上则返回空。这里，应该返回“生鲜-肉类-羊排”

⑤ 品类推荐服务器再将拿到的识别结果反馈给客户端。客户端展示“生鲜-羊排”

4.1.2 C端架构设计

TOC流程：

① 托寄物描述信息：客户端将真实的C运单商品信息推送给品类推荐服务器进行处理，商品名称举例：“一箱大苹果”

② 品类推荐服务器首先会在品类库进行全匹配，如果匹配上，则直接返回给客户端品类信息，结束。

③ 如果匹配不上则重复TOB的第二个步骤，品类推荐服务器给大模型输入预处理后的托寄物描述，预处理后的托寄物描述可参考如下模式：您的任务是根据#物品描述#提取出6个字内的物品的品类和名称，只返回最明确且能体现用户意图的那个。忽略地域，品牌，型号，重量，体积，尺寸，数量，价格，包装，形容词等干扰信息。输出JSON对象:<包含以下键：品类和名称>,如果无法提取或确认，则键值为空。这里的物品描述为#一箱大苹果#

④ 大模型根据输入的要求推理得到识别结果，#品类：水果，名称：苹果#

⑤ 识别结果与现有的品类库三级品类名称进行匹配，如果匹配上则将相应的品类返回给品类推荐服务器，如果匹配不上则返回空。这里，应该返回三级品类#生鲜-水果-苹果#

⑥ 品类推荐服务器再将拿到的识别结果反馈给客户端。客户端展示#生鲜-苹果#

4.2 准确性校验

4.2.1 实施前期准确性校验

为了验证大模型识别结果的准确性，我们随机选取了线上1000个不同品类的托寄物运单进行识别，然后将识别结果进行人工校验，将大模型匹配后的结果分为0未匹配、1 匹配且正确、2识别错误、3待决（有歧义需要讨论）、4有更精准的选项（有更精确的品类可匹配），去除人工无法识别的情况，最终结果有88%匹配，正确率在95%以上，基于此次验证，可以得到结论：可以将大模型识别结果应用到快递业务中。

4.2.2 实施后期人工干预矫正

此外，我们还有一个可人工干预结果的运营后台系统，大模型识别的结果会在该平台上进行展示，业务和运营人员可操作结果，分别为：无法识别、人工修复、新增品类和确认三级品类无误，一旦经过人工干预，后续大模型结果会按照人工干预的结果矫正返回。

无法识别：表示无论人还是大模型都无法识别，这类托寄物名称一般是较短的几个字，比如一个字或者两个字，太泛泛无法分析出所属的类别

人工修复：认为大模型识别错误或者不够准确，进行人为干预矫正，后续大模型识别的结果会按照矫正后的类别进行返回

新增品类：表示大模型识别的结果正确，但是无法匹配到现有品类库中的三级品类，并且经过业务核实确实缺少该品类，需要增加到现有品类库中

确认三级品类无误：表示大模型识别到的结果正确且能够匹配到现有品类库中的三级品类

4.3如何用更少的成本更快速的识别？

在本章节开头我们提到了京东快递业务量巨大，如果每一单都进行大模型识别，调用大模型的使用成本就会很高，业务成本无法把控。此外，AI智能识别是需要一定的思考时间，接口响应时间有长有短，下单流程不能因为识别接口响应较慢影响用户下单，如何用更少的成本进行更快速的智能识别？也是我们需要解决的一大难题。

为了把控成本，我们对托寄物名称进行分析，发现很多运单的托寄物名称相同，原因是B端商家在发货时，使用的基本都是商品名称，比如每天该商品销售了1000单，则这1000单的托寄物名称均为同一商品名称。同时为了解决大模型接口时效的问题，我们采取的策略是“预热”，具体方案如下：

设置一个预热缓存，下单进行托寄物识别时，首先在预热缓存池中查找是否之前已经识别过相同名称的托寄物，找到则直接返回缓存结果，找不到则返回空，并同步进行第一次大模型结果识别，识别后的结果再次放入缓存池中，等下次有同样名称识别时返回使用。

这样做的好处是：

① 不需要等识别结果，缓存取值时效能够得到保证

② 大大减少托寄物使用大模型识别的次数，极大的节约了成本

4.4 托寄物匹配准确后的效果

① 一些生鲜、酒水等需要特殊包装的托寄物，在匹配成正确的品类后，推荐更符合托寄物品类的路线和时效，促进快递路线更精确化，有效的减少了包裹的破损率，减少客诉

② 推荐更合理的增值服务，提升揽收效率，提高客单价

③ 针对现有品类提出更准确的命名，自动生成新的品类，补充丰富品类库，达到品类库标准化

④ 降低人工投入和纠错成本

⑤ 生成商家托寄物行业属性用户画像，定向推送优惠政策

下图是从今年1月至今年6月匹配率数据趋势图，从图中可以看到匹配率得到显著提升，由于目前还在灰度阶段，相信随着后续逐步放量，托寄物匹配率能达到更高的高度。

五、未来与展望

随着人工智能、机器学习和大数据技术的不断发展，托寄物识别技术的未来展望十分广阔。托寄物识别技术的进步将使得物流公司不仅能够提升物流效率和安全性，还能够利用这些技术生成更加细致和深入的商家托寄物行业属性用户画像。这种用户画像的生成，将基于对托寄物品类别、频率、体积、目的地等多维度数据的分析，从而描绘出一个全面的商家物流需求图谱。具体未来规划体现在以下几点：

个性化增值服务推荐：通过对托寄物品类型的深入分析，京东快递能够为不同客户推荐更加个性化的增值服务。例如，对于易碎品，系统会推荐特殊包装服务；对于高价值物品，推荐保价服务。这种个性化的服务推荐不仅提升了客户的使用体验，还有助于增加客户对京东快递服务的信赖和满意度。

预测未来揽收需求：利用大数据和人工智能技术，京东快递可以准确预测未来的揽收需求，提前安排快递员进行揽收，从而大幅提高揽收效率。这种预测性揽收策略，不仅优化了资源分配，减少了等待时间，还提高了整体的服务质量。

优化邮寄路线：通过对托寄物类型和邮寄频率的分析，京东快递能够重新规划邮寄路线，特别是对于需求量大的特定类型托寄物，如电子产品，系统可以规划专门的运输路线。

降低运营成本：通过提高托寄物匹配率，京东快递能够更精准地预测和规划物流资源，从而降低无效运输和重复分拣的成本。这种成本优化直接反映在运营效率的提升上，长期来看，有助于快递公司在竞争中保持优势，实现可持续发展。

高度个性化的服务提供：通过对商家托寄物行业属性的深入了解，物流公司能够为不同行业的商家提供更加个性化的物流解决方案。例如，对于经常托寄易碎物品的商家，物流公司可以提供特殊的包装和快递服务；对于需要跨境物流的商家，提供更加便捷的清关服务和国际物流方案。

向推送优惠政策：基于商家托寄物行业属性用户画像，物流公司可以更精准地定向推送优惠政策。这种定向推送不仅能够提升优惠政策的使用率和满意度，还能够增强商家的忠诚度。例如，对于常年有大量托寄需求的商家，物流公司可以提供量身定制的折扣方案或增值服务。

参考文献

[1] 笙婷婷.数字经济背景下我国跨境电子商务物流运作模式研究[J].商场现代化,2024,(11):38-40.DOI:10.14013/j.cnki.scxdh.2024.11.045.

[2] 郭永丽,高红.基于创新创业的应用型农村电商物流人才培养模式研究[J].中国储运,2024,(06):132-133.DOI:10.16301/j.cnki.cn12-1204/f.2024.06.003.

[3] Mun M ,Kim A ,Woo K .Natural Language Processing Application in Nursing Research: A Study Using Text Network Analysis and Topic Modeling.[J].Computers, informatics, nursing : CIN,2024

[4] García P D ,Benito C J ,Peñalvo G J F .Comparing Natural Language Processing and Quantum Natural Processing approaches in text classification tasks[J].Expert Systems With Applications,2024,254124427

[5] 杨紫超,吴恒,吴悦文,等.基于性能建模的深度学习训练任务调度综述[J/OL].软件学报,1-21[2024-06-24].https://doi.org/10.13328/j.cnki.jos.007202.

[6] 杨力,陈齐萌,朱俊奇.ChatGPT对物流行业发展的影响分析[J].安徽理工大学学报(社会科学版),2024,26(02):19-26.

posted @ 2024-07-09 20:44 京东云开发者阅读(381) 评论(0) 收藏举报

刷新页面返回顶部