一文了解机器学习类专利申请的权要撰写方式

发布时间: 2022-07-07

作者：王妮 专利工程师

随着人工智能技术的不断发展，机器学习类专利申请的申请量逐年增加。

近年来，中国已经成为人工智能专利申请的大国，不仅远超第二名的美国，而且人工智能专利申请数量增速也正以超出美国1~2倍的速度高速增长，创新势头迅猛。

在2018年1月～2021年10月，全球新增65万件人工智能专利申请。申请数量最多的国家分别为中国、美国和日本。其中，中国的申请数量已达到44.5万件，占比68.5%。

人工智能的创新目前仍处于非常活跃的阶段，至少在未来的3-5年里还将有更多的人工智能基础技术产生。与此对应的，人工智能专利的申请数量还将持续大幅增长。[1]

因此，对于专利代理师而言，掌握机器学习类专利申请，尤其是权利要求书的撰写方式成为一门必修课。

当专利代理师在撰写机器学习类专利申请时，可能会遇到应用现有模型的技术方案、同时涉及模型训练过程和应用过程的技术方案、以及需要撰写模型作用机理的技术方案。面对不同类型的技术方案，需要采用不同的撰写方式。基于此，对所能遇到的不同类型的方案的撰写方式进行汇总。

类型一：应用现有模型

部分机器学习模型已经发展成为能够直接加以利用的成熟模型，还有部分机器学习模型为已经进行了适应性训练的预训练模型。对于此类机器学习模型，权利要求书中可以仅对输入和输出结果进行描述即可。

案例1：以transformer模型为例的编码模型作为自然语言处理中的一种注意力机制模型，已经被广泛应用在特征深度交叉方面，以期学习出特征的高阶表达。因此，对于此类机器学习模型可以直接应用，并描述对应的输入和输出结果。

专利代理师在面对该案例时，采用了如下描述方式：

将特征向量输入至编码模型中，以使编码模型对特征向量进行编码处理得到嵌入向量。

案例2：BERT预训练模型是一种经典的以无监督的方式训练而成的语言训练模型，也能够对其直接应用，例如利用迁移学习后的BERT预训练模型对病例文本等数据进行校正。

专利代理师在面对相关案例时，采用了如下描述方式：

利用拼写校正模型对所述有效文本进行拼写校正得到校正文本。

不仅如此，还可以进一步对BERT预训练模型的迁移学习方式进行描述，例如：

获取正确文本样本和错误文本样本，并利用所述正确文本样本和所述错误文本样本微调预训练的拼写校正模型得到迁移学习后的拼写校正模型。

因此，对于预训练模型，除了描述应用过程之外，还可以对迁移学习的方式进行描述，以在审查意见答复阶段结合预训练模型的优势进行创造性争辩。例如，训练代价较小，配合下游任务可以实现更快的收敛速度，并且能够有效地提高模型性能，尤其是对一些训练数据比较稀缺的任务适用。换句话说，预训练方法可以认为是让机器学习模型基于一个更好的初始状态进行学习，从而能够达到更好的性能。

类型二：同时涉及模型的训练过程和应用过程

一些机器学习模型具备创造性的内容能够同时体现在机器学习模型的训练过程和应用过程中，因此，可以分别从机器学习模型的训练过程和应用过程两方面撰写，以全面保护两套主题的专利申请。

案例3：支持向量机是一类按照监督学习方式对数据进行二元分类的广义线性分类器。将已确定的年龄特征与年龄值样本输入至SVM，可以进行人脸年龄识别模型的训练。其中，SVM的核函数采用线性核函数。通过核函数来进行计算分类，主要用于线性分类，具有参数少和速度快的优点。

专利代理师在面对该案例时，采用了如下描述方式：

（训练模型阶段）一种年龄识别模型的训练方法，其特征在于，包括：

检测并提取待识别图像样本中的人脸的特征点，并预处理所述待识别图像样本，以提取所述人脸的全局特征；

基于所述特征点，提取所述人脸的局部特征，并根据所述全局特征与所述局部特征确定所述人脸的年龄特征；

基于所述年龄特征和年龄值样本，通过支持向量机对年龄识别模型进行训练。

对应的，在应用阶段，预先训练好的年龄识别模型可以是根据年龄特征与年龄值样本训练成的。因此，将已确定的年龄特征输入至该年龄识别模型中，可以输出该人脸的年龄值。

（应用模型阶段）一种年龄识别方法，其特征在于，所述方法包括：

检测并提取待识别图像中的人脸的特征点，并预处理所述待识别图像，以提取所述人脸的全局特征；

基于所述特征点，提取所述人脸的局部特征，并根据所述全局特征与所述局部特征确定所述人脸的年龄特征；

将所述年龄特征输入至预先训练好的年龄识别模型中，以得到与所述待识别图像中的人脸对应的年龄值。

根据案例3可以发现，在从机器学习模型的训练过程和应用过程两方面进行撰写的过程中，相同处理步骤的处理过程和对应描述是相同的，因此仅需对训练过程和应用过程的区别之处简单区分即可。其中，应用过程的区别之处的撰写方式可与类型一相同。

对于类型二所涉及的机器学习模型的训练过程和应用过程，大部分的机器学习模型的区别之处在于训练过程中存在“损失函数”作用。

当损失值不满足预期的情况下，需要对机器学习模型继续进行训练，直至训练完成；当损失值满足预期的情况下，才会进一步到达应用阶段。

换个角度思考，机器学习模型的应用阶段也只不过是“损失值”一定满足预期的情况。

因此，通过“损失值”这一连接点，即可将类型二中的机器学习模型的训练阶段和应用阶段进行统一。亦即，通过一套权要实现对训练阶段和应用阶段的机器学习模型进行保护的效果。

案例4：在训练阶段得到待验证分类向量，可以对该待验证分类向量进行重构，以根据重构损失值确定该待验证分类向量是否为语义分类向量。

在使用阶段得到该待验证分类向量，可以确定该待验证分类向量即为语义分类向量，也就是在重构损失值满足期望的情况下确定待验证分类向量为语义分类向量。

专利代理师在面对该案例时，采用了如下描述方式：

对所述语义文本向量和所述标准分类向量进行全连接处理得到待验证分类向量；

确定与所述待验证分类向量对应的重构损失值，以根据所述重构损失值确定所述待验证分类向量为语义分类向量。

类型三：撰写模型的作用机理

对于案例1，换个角度思考，编码模型只是实现编码处理的一种方式。其中，“实现编码处理”才是主要目的。

对此进行引申，在权利要求书中的撰写中，具体的机器学习模型显然并非是“必选项”，因此，可以通过描述机器学习模型的作用机理的方式，以使机器学习类专利申请“摆脱”机器学习模型的束缚，以使专利申请文件更加技术化、细节化和范围扩大化。

案例5：映射处理可以是利用word2vec模型对关联文本进行处理实现的，但是，可以通过对映射处理这一处理过程的描述“省去”对word2vec模型，甚至上位的词向量生成模型的限定。

专利代理师在面对该案例时，采用了如下描述方式：

获取原始文本，并对所述原始文本进行分词处理得到关联文本；

对所述关联文本进行映射处理得到关联文本向量。

在此过程中，并未提及word2vec模型，而是对word2vec模型所实现的映射处理的目的进行限定。可以发现，采用这种方式之后，专利代理师省去了对机器学习模型的上位过程，而是转变成对具体的机器学习模型的作用机理的学习和掌握，各有优缺。专利代理师在实际工作过程中，可以根据具体方案或者不同客户采取对应的处理方式。

总结

综上，对于应用现有模型的技术方案，可以采用直接描述输入和输出结果的方式。当该现有模型为预训练模型，会在不同领域存在对应的迁移学习过程，还可以根据实际情况对迁移学习过程进行描述。

对于同时涉及机器学习模型的训练过程和应用过程的技术方案，可以分别从训练过程和应用过程两方面进行撰写，全面保护技术方案的不同主题。除此之外，因为节省权项或其他原因，还可以通过“损失值”将机器学习模型的训练过程和应用过程统一描述，实现一个权项同时保护训练阶段和应用阶段的机器学习模型的目的。

对于涉及机器学习模型的作用机理的技术方案，可以通过描述机器学习模型的作用机理的方式省去对机器学习模型的上位和限定，从而起到扩大专利申请文件的保护范围的效果。

以上所涉及的几种机器学习类专利申请的权利要求书的撰写方式均为笔者在代理机器学习类专利申请的过程中总结所得，如有不足之处，还请批评指正。

参考文献：[1] 2021年人工智能专利综合指数报告[R].智慧芽.2021-12-16.

返回上一页