浅谈机器学习领域中有关创造性的审查意见答复

发布时间: 2023-02-10

作者:张阳阳 专利代理师

机器学习领域的专利申请中有一类典型的技术方案,该类技术方案不涉及对机器学习模型或者相关处理过程作出改进,而是仅强调机器学习模型在特定场景中的应用。对于此类技术方案,在答复审查意见时往往会被指出创造性偏低。针对于此,本文将围绕“三步法”的各个步骤,结合输入数据与机器学习模型之间的内在联系,从应用场景对创造性的影响、技术构思对区别技术特征的影响、技术特征的作用、“公知常识”的影响等多个方面,浅谈机器学习领域中有关创造性的审查意见答复的若干策略。

一、机器学习领域创造性答复特点概述

随着机器学习技术的发展,机器学习领域的专利申请量大幅增加。在机器学习领域的专利中,存在一类典型的专利申请,其技术方案不对具体的机器学习模型结构作出改进,也不对与机器学习模型结构存在关联的处理过程作出改进,而仅强调通过现有机器学习模型,结合特定场景中的数据进行一般性训练过程或者一般性预测过程,以实现特定场景中的改进。此类专利在实质审查阶段经常会被审查员指出缺乏创造性,从而据此驳回专利申请。

这类专利申请之所以创造性偏低,部分原因在于,其改进原理或者改进方向与机器学习的基本定义高度重合。机器学习技术的基本定义为:在预定义好的可能性空间中,利用反馈信号的指引来寻找输入数据的有用表示。在实际的技术方案中,往往是训练阶段通过机器学习模型学习已知数据的规律,并在预测阶段通过这种规律对未知数据的某种属性进行预测。在此基础上,如果专利申请中技术方案仅仅是将特定输入数据输入至机器学习模型进行一般性训练和预测,那么其实际上应用了机器学习技术广为人知的基本定义,改进层面仅仅是选择了合适的输入数据。而如果输入数据的选择在行业内是公知的,那么这种改进过程是“显然的”、“理所应当的”,从而相对而言更不具备“非显而易见性”。

然而,在很多案例中,“输入数据的选择在行业内是公知的”这一点并不一定成立,且可能是一种“后见之明”。为了一定程度上避免这种“后见之明”,本文将结合“三步法”,对机器学习领域的创造性答复策略进行具体讨论。

二、结合三步法分析机器学习领域的创造性答复

1)确定最接近的现有技术

对于不涉及具体模型改进的技术方案而言,由于改进点在于“输入数据的选取”,从而确定最接近现有技术具有一个至关重要的作用,即:确定适用于本申请的输入数据的现有技术方案。

其原因在于,机器学习领域的输入数据严格限定着机器学习模型的用途,从而限定着技术方案的实质内容。那么最接近的现有技术作为改进基础,其所在场景下的机器学习模型应当完全适用采用本申请的输入数据,否则一旦输入数据不合适,学习数据中的规律将无从谈起,那么没有理由对最接近现有技术的输入数据作出本申请中涉及的变更。

案例一

本申请涉及一种水位预测方法,主要技术方案包括:将由降水量以及水库水位构成的时间序列数据,输入至多任务预测模型,得到水位预测结果。多任务预测模型包括主任务和相关任务,主任务基于水位的时间序列数据进行预测,相关任务基于降水量的时间序列数据进行预测。

通知书评述内容主要包括:最接近的现有技术对比文件1公开了一种基于长短时记忆网络的水车室水位智能预测方法,主要技术方案包括:将水车室水位信息的时间序列数据输入至预测模型进行预测,得到水位预测结果。而对比文件2公开了采用多任务学习进行语言分类。而降水量会对水位造成影响属于公知常识,那么在此基础上结合对比文件1-2和公知常识,得到本申请不具备创造性。

可以看出,审查员在通知书中直接指出了降水量会对水位造成影响属于公知常识,那么可以推论出审查员认为多引入一个降水量作为输入数据不会给技术方案带来创造性,其潜在意思在于“降水量当然会影响水位”。其实不然,对比文件1的场景下降水量就对水位没有影响。

对比文件1记载了其是通过水车室水位的时间序列数据,对水车室的水位进行预测。水车室就其字面意思而言可以推断是一种室内环境,这种室内环境的储水设备的水位并不会受到降水量的影响,因此,在其采用机器学习模型进行水位预测时,降水量与水位之间没有可供机器学习模型学习的规律,无法采用降水量作为输入数据。

如此,对比文件1作为最接近的现有技术实际上是不太合适的,仅仅考虑到本申请采用了降水量作为输入数据,就无法基于对比文件1作为本申请的改进起点。

在案例一中,可以就对比文件1不适合作为改进起点的理由进行阐述,一旦阐述的理由恰当,则可以促使审查员更换最接近的现有技术,有时更换后的最接近现有技术更易于进行创造性答复。

2)确定发明的区别技术特征和发明实际解决的技术问题

在第二步中就需要结合技术方案的构思确定审查员所处的区别特征是否准确,如果构思相似则只要字面描述上相似就可以视作被公开,但如果构思差别大则不能只看字面描述,否则可能会导致区别特征几乎缺乏实质技术意义,进而第三步难于论述非显而易见性。以下结合两方面进行阐述。

一方面,如果技术方案的整体构思相似,且大部分区别特征被最接近现有技术所公开,则可以进一步分析最接近的现有技术与本申请的机器学习模型的输入数据是否仍存在区别点,并分析此区别点对技术方案的实质以及所解决的技术问题之间的联系。

案例二

本申请涉及一种办公区的灯光控制方法,主要技术方案包括:获取当前楼层的实时热图像,将实时热图像输入预先训练完成的机器学习模型中,由该机器学习模型输出当前楼层是否有人的结果,如果有人,再通过人脸识别确定人员位置并对该位置进行灯光控制。

对比文件1公开了一种基于人体探测的照明控制方法,通过将获取的照明区域的图像输入至概率背景模型,判断图像中是否有移动的物体,并判断移动物体是否为人,如果有人出现在照明场所的某一区域,则将图像从RGB颜色空间转换为HSV颜色空间,结合转换后的图像控制该照明区域的亮度。

对比文件1的图像则是由CCD等相机拍摄的物体和人的光学成像,其涉及的图像用于记录视觉特征,机器学习模型依赖图像中的物体的视觉特征实现人的检测。而本申请中的“热图像”是一种记录物体本身或向外辐射的热量或温度的图像,其用于记录热量特征,机器学习模型对人体表面的热量分析规律并进行预测,从中推断出人的存在。

因此,区别特征还包括机器学习模型的输入数据是实时热图像。根据说明书中记载的与实时热图像相关的描述,办公区的设备也会散发热量,这种热量可能与人体热量相似从而对预测准确性造成干扰,为了提高机器学习模型判断结果的准确性,还通过采集不同时间段的实时热图像,并通过各时间段对应的机器学习子模型进行训练,以提升机器学习模型的准确性。通过提取上述特征,可以确定发明所实际解决的技术问题是:如何提高机器学习模型预测办公区域是否有人的准确性。

在案例二中,即便是采用通用机器学习模型进行数据预测,如果可以证明输入数据的选取与技术方案的实质联系以及其带来的好处,那么可以使得审查员清晰地了解到改进点所在。此案与审查员沟通过程中,代理人强调了输入数据实时热图像存在实质差别以及与此对应所能解决的技术问题,审查员认为采用热图像实现上述目的不常见,便认可了其非显而易见性并予以授权。

另一方面,针对不涉及机器学习的具体处理过程改进的技术方案,往往采用比较宽泛的方式进行描述,与最接近现有技术的区别往往在于输入数据不同,一旦将输入数据视作等同概念,这就为审查员逐句进行比对带来了便利。在排除输入数据之后,只要拆开来看,几乎每句话都是可以在最接近现有技术中找到更下位的概念的,然而最接近现有技术与本申请的技术构思可能差异很大,不适合如此评述区别特征。

案例三

本申请涉及一种控制命令混淆方法,主要技术方案包括:通过将接收的混淆命令输入至命令识别信息对应的命令翻译模型,预测得到控制命令;混淆命令为字符串、音频、图片、视频中的一种。

对比文件1公开了一种位置获取方法,主要技术方案包括:对由四个位置信息组成的位置信息集合输入至混淆模型进行混淆处理,将混淆处理后的位置信息集合进行发送后,接收方通过混淆处理的逆过程对位置信息集合进行解混淆,从而得到四个位置信息中两个初始位置信息作为所需获取的信息。

通知书指出,本申请的区别特征仅仅在于:将位置信息替换成混淆命令,同时限定了混淆命令的数据形式,而这些区别特征均属于公知常识。

如果忽略输入数据方面的区别,那么对比文件1和本申请都是将某种混淆的信息通过机器学习模型映射成原始的信息。但是,机器学习模型在本申请中有一种特殊用途,即:将控制命令隐藏起来,以避免控制命令泄露。其利用了机器学习模型的“隐蔽性”,即机器学习模型内部实现机制是无法被推断出来的,网络安全中的现有思路是采用各类加密算法对控制命令进行加密,对比文件1与本申请的原理实际上是不同的。

本申请的主要原理是:在训练阶段通过混淆命令以及控制命令对预设的神经网络模型进行训练,从而形成混淆命令与控制命令之间不透明的映射关系,可以理解为训练的是神经网络模型把混淆命令转换为控制命令的能力,在该能力达到所需的标准之后,将神经网络模型确定为命令翻译模型,从而在预测时直接对混淆命令预测得到控制命令。

为了强调这一点,答复过程中还限定了“命令翻译模型由服务器通过由混淆命令以及控制命令组成的训练数据集,对预设神经网络模型进行训练得到,命令翻译模型相当于混淆命令与控制命令的映射关系”。以下结合对比文件1的记载内容具体阐述两者有何不同。

一方面,从混淆过程来看,对比文件1的混淆是将四个位置拆分重组、重新排序,其混淆处理的结果是四个位置之间新的对应关系;而本申请的混淆也不存在对原始控制命令拆分重组或重新排序,而是通过图片等数据作为控制命令对应的混淆命令,通过混淆命令和控制命令对机器学习模型进行训练。

另一方面,从解混淆过程来看,对比文件1利用预设解混淆算法重新建立每两个位置信息之间的对应关系,解混淆是混淆的逆过程,比如当混淆采用的是某算法,则解混淆采用某算法的逆算法。而本申请的预测并非混淆的逆过程,而是将混淆命令直接输入命令翻译模型,命令翻译模型预测得到控制命令。此外,机器学习模型的映射是从信息A到信息B,是一种单向映射的过程,不可能存在逆过程,无论是训练阶段还是预测阶段,都是通过混淆命令预测出控制命令。如此也可以说明本申请预测过程与对比文件1的解混淆不同。

在案例三中,本申请涉及的机器学习模型是一种通用模型,没有指出是哪一种机器学习模型,且训练和预测过程本质上是一般性过程,仅仅是在其中融入了混淆命令和控制命令这种数据形式,体现了特定场景下机器模型的特定用途,但现有技术中却很难找到类似的技术方案。因此在确定区别特征时,需要结合输入数据分析技术方案的整体构思、实现原理与最接近现有技术的差异点,如果技术构思和原理不同,则应当尽可能避免逐句拆分开来理解,而是可以结合本申请整体方案,阐述与最接近现有技术记载的内容具体有哪些区别。

3)判断要求保护的发明对本领域技术人员来说是否显而易见

判断非显而易见性,实际上是判断现有技术是否给出了将第二步中确定的区别特征,应用到第一步确定的最接近现有技术中以解决其存在的技术问题(第二步确定的发明实际解决的技术问题)的技术启示。

第三步相对而言更容易采用主观的视角进行评价,极容易引入公知常识作为评价依据。虽然难于直接证明区别特征并非公知常识,然而由于公知常识也是用于应用至最接近现有技术中的,因此可以尝试结合区别特征、技术问题进一步讨论本申请与最接近现有技术之间的关系,并在此基础上分析为何本申请不是简单地将公知常识应用至最接近现有技术,则有可能侧面反映出不是机械地将最接近现有技术与公知常识拼凑。

针对上述案例一

答复过程中审查员更换了对比文件,其中,对比文件3公开了一种基于循环神经网络和卷积神经网络的智能水位预测方法,主要技术方案包括:通过空间上连续的多个水位站的历史水位数据,预测中间水位站未来的水位数据。本申请与对比文件3的区别特征主要包括:时间序列数据还包括降水量信息的时间序列数据;多任务学习模型的具体结构。对比文件4涉及采用降水量得到水库水位,另外多任务学习模型的具体结构属于公知常识。从而对比文件4以及公知常识给出了将区别特征应用到最接近现有技术中的技术启示。

对比文件3机器学习模型的输入数据是空间上连续的水位站的水位,其输出数据是中间水位站的水位,其实际上是通过机器学习模型学习多个连续水位站的水位对中间水位站的水位的影响规律。而本申请通过多任务学习模型学习历史降水量以及历史水位对未来水位的影响的规律。虽然水位站也是露天环境,会受到降水量的影响,但是,多个水位站中距离较远的水位站的降水量不一定对中间水位站的水位造成影响,表现为空间上不相关或者相关性弱。而多任务学习模型中,主任务和相关任务需要具有相关性,相关性弱的数据会不利于多任务模型学习数据中的规律,不利于预测中间水位站的规律,从而本申请的上述区别特征并不适用于对比文件3。

多任务学习技术本身固然属于公知常识,然而,多任务学习并非必然能够提升模型预测的准确率,在采用多任务学习技术时,本领域技术人员还需要确定如何选取主任务以及相关任务的参数,以及如何设置合适的模型结构,因为相关任务的参数设置不合理的情况下,模型预测的准确率不一定会升高,并且,模型结构设置不合理同样可能造成水位预测的准确率低,而在水库水位预测领域,公知常识仅仅是基于通常的单任务模型进行预测,没有任何现有技术记载通过多任务学习能够提高水库水位预测的准确率,也没有任何现有技术记载通过降水量作为相关任务能够提升水库水位预测的准确率,因此本申请所涉及的具体的主任务以及相关任务的限定、模型具体结构的限定不属于公知常识。

在案例一中,虽然多任务学习模型属于公知常识,但是,在预测水库的水位时,仍然需要考虑多任务学习模型的主任务和相关任务分别如何选取输入数据,以提高预测准确性,比如在最接近现有技术中,多任务学习和降水量就不适用于其对应的机器学习模型。

针对上述案例三

在案例三中,审查员认为控制命令通常用音频、图片、视频等形式表现,属于公知常识。然而,现有技术中控制命令从未采用音频、图片和视频形式表现,控制命令比如“ping”、“reboot”,一般是不会采用上述数据形式展现的,缺乏相应的应用场景。

另外,最接近的现有技术中,机器学习模型的输入数据是多个位置信息,多个位置信息可以进行任意的拆分、重组,而音频、图片、视频本身都是封装好的数据格式,无法进行拆分和重组,因此也不可能将上述数据形式应用到最接近的现有技术中。

本申请实际上是通过音频、图片、视频或者字符串来指代控制命令被混淆后的数据形式,而进一步通过命令翻译模型将这种混淆的数据预测出对应的控制命令。输入数据之所以具有上述表现形式,是为了隐藏控制命令,这一点既不常见,也不适用于最接近的现有技术。因此,现有技术并未给出将区别特征应用至最接近现有技术的技术启示。

三、总结

综上所述,针对机器学习模型的具体结构和相关处理过程没有改进的技术方案而言,机器学习模型的输入数据往往是技术问题与技术方案之间的桥梁,并且严格限定着机器学习模型应用场景的边界,而不同应用场景之间往往并不能随意的改变输入数据。在进行答复时,可以适当关注本申请输入数据与对比文件的输入数据存在的差异点,并进一步找出应用场景上的差异点,结合应用场景的差异点分析技术方案实质区别,实现原理上的区别,以体现出本申请的实质改进在哪里。

以下对本文涉及的几个答复策略进行总结,包括:

1、考虑本申请的输入数据是否适用于最接近现有技术所在的场景,如果不适用,指出最接近现有技术的对应场景下,机器学习模型为何无法从该输入数据中学习到所需的规律,导致无法解决其存在的技术问题。

2、如果本申请与最接近现有技术的技术构思相似,且现有技术公开了大部分技术特征,那么则需要考虑本申请的输入数据与最接近现有技术中的输入数据有何差异点,两者各自的机器学习模型从各自的输入数据中学习的是何种规律,为什么两者要学习这种规律,尤其本申请学习这种规律之后,是否还能够解决其它技术问题,并注意将解决该技术问题的相关技术特征设置于独权中。

3、如果本申请与最接近现有技术的技术构思不甚相似,那么则要避免逐句比对技术特征,而需要联系本申请原本要解决的技术问题,分析本申请中输入数据与机器学习模型之间的关系,分析本申请采用机器学习模型学习了输入数据的何种规律,这种规律为何依赖于其它部分的技术特征,从而使得不应当将其它部分的技术特征单独拆分出来进行比对。在整个陈述意见中,都围绕机器学习模型如何处理输入数据以解决技术问题,来强化两者的联系,避免单独对某一个步骤进行分析。

4、在论述区别特征并非公知常识时,可以分析区别特征与最接近现有技术的关系,如果发现区别特征不适合于最接近的现有技术的技术方案,那么则可以反映出区别特征并非适用于所有技术方案,既然并不适用于所有技术方案,那其用途就不“公知”,而是需要结合特定场景进行改进后才能应用区别特征。由此可以进一步分析,本申请在应用区别特征时,还需要作出哪些改进,以使得其适用于本申请中以解决特定的技术问题。比如机器学习模型中有时输入数据选取的不合适会降低模型预测的准确性,那么在最接近的现有技术中,为何引入相应输入数据会降低模型的准确性,而本申请为何不会。又比如,在最接近现有技术记载的原文中,往往存在诸多细节,可以尝试找到其关键技术方案中不适合结合区别特征的技术方案,并从技术问题和技术原理方面,对照分析本申请为何就适合设置该区别特征,从而体现出本申请为了设置区别特征做出了什么样的改进,使得其并非公知常识。

返回上一页