一种生活垃圾塑料瓶分类中的数据均衡方法与流程

频道:生活应用 日期: 浏览:25

一种生活垃圾塑料瓶分类中的数据均衡方法与流程

本发明涉及国内废物分类的技术领域,尤其是在家庭废物塑料瓶中分类中的数据平衡方法。

背景艺术:

随着城市化的裂变和发展,家庭废物也大大增加了。大多数城市都经历了严重的垃圾攻城问题,塑料瓶是常见的家庭废物之一。塑料瓶堆积在垃圾填埋场中,不仅没有足够的土地,而且还具有严重的生态污染。更糟糕的是,塑料瓶垃圾的数量持续增长,城市垃圾的积累对周围居民的健康造成了巨大伤害。

通过对塑料瓶的分类来解决塑料瓶回收问题,并减少定量,资源利用和垃圾的无毒性。可回收的废物塑料瓶可以重新处理为原材料以创造新价值。

不同材料的塑料的物理和化学特性存在很大差异,塑料需要按材料进行分类。对于当前的实际情况,塑料瓶具有相对单一的成分但颜色不同,塑料瓶可以按颜色进行分类,以便获得带有单一成分和单色的塑料瓶,并最终获得优质质量的再生塑料。

传统分类主要依赖于手动分类,手动分类效率低下,不能大规模地分类为塑料瓶垃圾。人工智能提供了大规模塑料瓶颜色分类的可能性。分析输入图像,训练卷积神经网络,并获取诸如塑料瓶的颜色,大小,坐标之类的信息,以快速准确地检测塑料瓶。

数据类别中的严重失衡是神经网络在现实生活中应用的主要障碍。班级失衡会影响训练阶段的融合,从而导致训练模型的重点是大量样本和鄙视类别的类别,并带有少量样本。模型在测试数据上的概括能力将受到影响。在现实生活中获得的数据集中,瓶子颜色类别被严重倾斜,透明塑料瓶数量最多,其次是棕色和蓝色的塑料瓶,紫色,黄色和红色塑料瓶的数量很小,而且透明塑料瓶的数量是紫色等。类别数量超过100,000倍,因此解决数据不平衡至关重要。

通常,解决数据不平衡问题可以从数据级别和算法级别开始。在数据级别,可以通过数据重采样来平衡训练集样品。对于较少样品的类别,使用了UPSMPLING,即复制该类的图像,直到与最大类的样品数量匹配为止。对于更多样品,使用下采样。在批处理训练期间,严格控制每批随机选择的图像中随机选择的图像数量。在塑料瓶颜色分类项目中,只有十二个紫色瓶数据,透明瓶的数量高达100,000。如果仅复制紫色瓶子的数量,则可能导致该模型过度拟合。

如果从算法级别求解数据不平衡,则可以增加小样本中错过的罚款成本,并且可以直接反映在目标函数中,即成本敏感的方法。由于瓶颜色分类项目的类别数量中存在多个数量级偏差,因此在调试罚款参数时很难适应适当的值。

因此,先前的艺术需要进一步的改进和改进。

技术实施元素:

本发明的目的是克服先前艺术的缺点,并提供一种数据均衡方法来解决垃圾塑料瓶的颜色分类中严重的不平衡问题。

本发明的目的是通过以下技术解决方案实现的:

塑料瓶的家庭废物的分类中的数据平衡方法,该方法主要包括以下特定步骤:

步骤S1:收集,组织和分类数据集。

具体而言,步骤S1中的数据预处理过程需要设置特定和清晰的分类规则,并且不应模糊分类边界;如果图像中出现多个塑料瓶,则必须先将图像分开,并仅分为包含塑料瓶的样品图片。

步骤S2:设计编码器,包括下采样和残留块,并获得编码的特征图。

具体而言kaiyun全站网页版登录,步骤S2的编码器输出特征映射的不同通道结合了图像的不同特征,图像的特征向量IE,编码是根据这些特征从源域转换为目标域的。

步骤S3:设计注意模块,包括完全连接的层和辅助分类器。

具体而言,步骤S3的注意模块用于指导图像生成模型,并将注意力集中在某些重要领域。注意模块中的辅助分类器获得了注意图并区分了源和目标域,因此可以在生成过程中以目标方式将系统转换为特定区域。

步骤S4:设计解码器,包括自适应残留块和上采样。

具体而言,在步骤S4中,注意模块的输出用作归一化模块的输入,并通过残留块和UPSMPLING获得转换后的生成图像。自适应归一化模块结合了注意模块,以指导模型利用从训练中学到的超参数值的帮助可以灵活地控制图像形状和纹理的变化。

步骤S5:设计鉴别器,鉴别器和发电机具有相似的结构。

具体而言,在步骤S5中,鉴别器将解码结果转换为判别输出,并由全球歧视者和局部歧视者组成。与局部歧视器相比,全局判别器在输入图像上执行更深的特征压缩。

步骤S6:设计损耗功能。

具体而言,在步骤S6中,损耗函数由四个部分组成,训练两对生成器 - 歧义器网络将图从一个域转换为另一个域,而转换过程需要满足环状一致性。

步骤S7:准备模型培训的训练集。

具体而言,在步骤S7中,在训练期间,不需要配对的数据集条件,两个镜像对称对抗会生成网络gan以形成环网。从域A到一个域B和一个域B到A域的单向GAN结构,两个GAN共享两个发电机,每个都有一个歧视器。

步骤S8:使用结果的权重文件使用测试集并合成需要放大的类别样本。

具体而言,在步骤S8中,当发电机损耗和鉴别器损耗值往往处于平衡状态,分析损失值的变化时,训练将停止,并在测试最佳迭代次数下选择重量文件,并获得现实的复合图像。

本发明的工作过程和原则是:

与先前的艺术相比,本发明也具有以下优势:

(1)本发明提供的家庭废物塑料瓶中的数据平衡方法具有强大的鲁棒性和出色的合成效果。

(2)本发明提供的家用废物塑料瓶分类中的数据均衡方法基于注意机制,该方法可以针对关键区域的形象,正确处理区域之间的几何变化,并在一定程度上灵活控制。合成图像形状和纹理的效果。

图纸的附加描述

图1是本发明提供的家庭废物塑料瓶分类中数据均衡方法的流程图。

图2是本发明的数据均衡方法图像生成网络的注意模块的结构图;

图3是自适应层的归一化残留块结构图,示例的归一化残余块是本发明的数据均衡方法的图像生成网络;

图4是本发明的数据均衡方法的图像生成网络的归一化模块结构图;

图5是本发明的数据均衡方法的图像生成网络的综合结果(源域是透明的塑料瓶,目标域是绿色塑料瓶);

图6是本发明的数据均衡方法的图像生成网络的合成结果(源域是透明的塑料瓶,目标域是蓝色塑料瓶)。

特定的实施方法

为了使本发明的对象,技术解决方案和优势更清晰,更清晰,本发明将在下面的图纸和示例中进一步解释。

根据本发明的技术术语来解释和解释以下内容:

全球最大池:最大池保留纹理特征。合并的作用反映在缩减采样,保留重要特征,降低特征维度和扩大内核接受场中。您回去的越多,就越能捕获对象的语义信息。该语义信息基于更大的接受场。最大池必须满足不变的梯度总和的原理。全局最大池的正向传播将整个特征映射中的最大值传递到下一层,而其他像素的值直接丢弃。反向传播将梯度直接传输到上一层中的像素,而其他像素不接受梯度,即0。因此kaiyun全站登录网页入口,全局最大池和全局平均池之间的差异是记录了池期间的最大像素值。

全球平均池:平均池保留整体数据特征,计算每个特征映射的所有像素点的平均值,并输出数据值。如果要输出批处理映射,则将输出批处理数据点,并且这些数据点形成1 *batchsize vector,即将特征向量发送到SoftMax层等进行分类。完整的连接层具有许多参数,慢训练和易于过度拟合。全局平均池取代了完整的连接层,直接消除了完整连接层中的黑框特征,直接使每个通道具有实际的类别含义,并构建了整个网络。正规化以防止过度拟合。

UPS采样:也就是说,扩展功能映射。有许多用于上采样的方法,例如常用的双线性插值,它们会根据UPS采样率创建较大的特征映射来插值。特征图之间的上采样彼此独立,因此通道数量不变。

下采样:也就是说,要减少特征图。卷积过程中的下采样层是在降低图像后提取特征,同时汇总降采样是为了减小图像尺寸。

示例归一化:将归一化应用于特定的图像实例,并将其归一化。

层归一化:层归一化不会计算微型批次中所有特征的平均值和方差,而是沿批处理尺寸将C,H和W的三个维度归一化,从而克服了对批处理大小敏感的批次态度的劣势。

完整连接的层:全连接层在整个卷积神经网络中扮演“分类器”角色。卷积层,合并层,激活功能层等。将原始数据映射到隐藏层特征空间,并且完全连接的图层将学习的“分布式特征表示”映射到样品标记空间。通常,完整连接后,将有激活功能进行分类。如果激活函数是多分类的软磁性,则完全连接的图层将通过最后一层卷积到向量获得的特征映射扩展到向量,最终乘以矢量,然后降低其维度,然后输入到SoftMax层到达softmax层到获取每个类别的分数。

1*1卷积:要在不同渠道的相同位置实现信息融合以及降低渠道数量的维度的增加或维度增加kaiyun全站app登录入口,您可以使用较低的操作成本来通过更改通道维度来增加网络的复杂性并添加非线性提高网络的表达能力。

辅助分类器:由于网络很深,因此梯度传递到先前的层时可能会消失,因此定义辅助分类器。辅助分类器将中间的特定层的输出作为分类,并将其添加到最终分类结果中,重量较小。这与模型融合相同,并在网络中添加了反向传播梯度信号,这也为培训整个网络提供了额外的正则化非常有益。

示例1:

如图2所示。 1至6,此实施例以基于对抗生成网络的垃圾项目分类中的数据均衡方法,该方法包括以下步骤:

步骤1)收集垃圾塑料瓶的图像数据集,组织数据集,然后根据颜色对其进行分类。

步骤2)为图像样均衡方法设计一个生成对抗网络模型。该构想的方法是无监督的图像到图像翻译,旨在设计基于生成对抗网络的网络结构,并将注意模块与归一化模块相结合。

步骤3)模型分为生成器和歧视器。首先,设计发电机模块。发电机包括编码器,注意模块和解码器(包括自适应层实例归一化模块)。

步骤4)编码器设计。输入图像首先通过下采样模块,然后通过残差块以增强图像特征的提取,最后获得编码的特征映射(batchsize,h,w)。

步骤5)发电机包含一个注意模块。接下来是注意模块的设计。

步骤6)输入图像被倒置并剩余块以获得编码的特征图,并且通过全局平均池和全局最大池,获得了与通道数量相对应的特征向量。获得高参数重量值。重量值的大小代表了通道相应特征的重要性。它被压缩为通过完整的连接层进行批处理*1维度。

步骤7)将注意模块获得的输出作为归一化模块的输入,并通过多层感知机获得两个高参数值。然后,可以通过残留块和上采样获得转换后的生成图像。

步骤8)接下来是歧视器模块的设计。鉴别器模块的结构与生成器的结构大致相似。

步骤9)歧视者的结构由全球歧视者和地方歧视者组成。

步骤10)连接全局歧视者和本地歧视者的输出结果。

步骤11)设计损失功能。损失函数包括四个部分:对抗损失,循环损失,身份损失和CAM损失。

步骤12)将带有最多样品数量的透明塑料瓶放入训练集A中,然后将需要放大的样品(例如紫色塑料瓶)放入训练集b。

步骤13)在设置参数之后,例如学习率,迭代编号和保存权重文件的路径,开始培训。

步骤14)在训练过程中,随着迭代次数的增加,发生器损失和歧视损失值趋向于平衡状态。

步骤15)准备测试集,测试的目的是获取从透明塑料瓶中转换的紫色塑料瓶的图像。

步骤16)最后,获得现实的生成结果。遵循相同的步骤获得黄色,红色,黑色,棕色和其他类别的合成塑料瓶。

在第2步中构建网络模型时,有必要从GAN结构中学习的原因是,图像翻译是GAN的主要应用程序场景之一,图像修复和图像样式转换都属于Image-图像转换。

尽管GAN具有许多优势,但图像翻译仍然是一项具有挑战性的任务。因为大多数实现仍然仅限于本地纹理转换。如果应用于图像差异明显的情况,则GAN的效果将不是理想的。为了在无样品类别中生成更现实的塑料瓶数据,需要设计出强大的图像转换模型。

第5步中注意模块的功能是指导图像生成模型将注意力集中在某些重要领域。为了允许系统在发电期间更具目标转换特定区域,注意模块中的辅助分类器获得了注意图。 ,区分源域和目标域,并期望将源域和目标域尽可能分开。重要的区域是该模型需要知道的要密集转换的位置。它是图像真实性的最重要歧视区域。发电机可以使用此区域。以目标方式生成。

一些以前的基于注意力的方法无法正确处理域之间的几何变化,而本发明的注意模块在一定程度上减轻了这一问题。 IT和传统注意模块之间的差异之一是它不再关注计算图的重量值。

在步骤7)中,可以将自适应层实例归一化模块与注意模块结合使用,以指导模型使用训练中学到的超参数,从而灵活地控制图像形状和纹理的变化量。此步骤增强了模型的鲁棒性。

自适应归一化模块是实例归一化和层归一化的组合。通过示例将发电机中的编码器部分进行标准化,并且发电机的解码器部分通过图层进行了归一化。

在步骤8中,鉴别器的功能是将解码过程转换为相对于发电机的判别输出。由于无需在歧视器中对源和目标域进行分类,因此没有将注意力模块添加到歧视器中。

在步骤9)中,全局歧视器在输入图像上执行比本地歧视器更深的特征压缩,并且接受场在全球级别上作用,超过了图像的原始大小。局部鉴别器的接受场不如图像大小那么大。

在步骤14)中,在训练过程中不需要配对的数据集,并且两个镜像对称gan形成环网。它由一个从域A到一个域B的单向gan和一个从域B到域的单向gan组成。这两个甘斯共享两个发电机,每个发电机都有一个歧视器,因此有两个发电机和两个歧视器。

本发明提供的家庭废物塑料瓶分类中的数据平衡方法具有强大的鲁棒性和出色的合成效应,并且具有广泛的市场应用前景。

示例2:

与无花果有关。 1至6,该体现在国内废物塑料瓶的分类中披露了一种数据均衡方法,包括以下特定的实施步骤:

步骤1)收集垃圾塑料瓶的图像数据集,组织数据集,然后根据颜色将其分为多个文件夹。

步骤2)为图像样均衡方法设计一个生成对抗网络模型。该构想的方法是基于生成对抗网络的无监督图像到图像的翻译,旨在设计端到端(从一个分布到另一种分布),并结合了注意模块的网络结构和归一化模块。

步骤3)模型分为生成器和歧视器。首先,设计发电机模块。发电机包括编码器,辅助分类器和解码器。

步骤4)编码器设计。输入图像首先通过下采样模块,然后通过残差块以增强图像特征的提取,最后获得编码的特征映射(batchsize,h,w)。

步骤5)发电机包含一个注意模块。接下来是注意模块的设计。

步骤6)编码器的特征映射输出分为两个通道。获得了特征图的全局最大池(批处理,1,1)输出。通过完整的连接层,可以获得节点的预测逻辑,并传输此完整连接层的参数。也就是说,批次化的权重值乘以编码特征映射的相应位,并给出编码特征映射的每个通道,以在最大池中获得对注意力友好的特征映射。重量值的大小表示通道相应特征的重要性。另一个功能地图的全球平均汇总,然后同一操作在全球平均池中获得了注意力友好的特征图。

步骤7)连接获得的两个注意力图,以获得批处理*2维通道的H*W特征图。获得的新功能映射还分为两个路径,通过1*1卷积层,并将通道变成批处理尺寸并发送到解码器。其他路径通过完全连接的层,并获得了批处理尺寸通道的两个高参数值作为自适应归一化模块的参数。

步骤8)将批处理*2维功能向量发送到辅助分类器进行分类。此分类过程是一个无监督的学习过程,该过程对源域和目标域进行了分类,以帮助模型知道在哪里执行集中式转换。

步骤9)发电机还包括一个自适应归一化模块,该模块恢复了通道输入数量的通道数,并将其发送到归一化模块以进行自适应归一化。

步骤10)将注意模块获得的输出作为归一化模块的输入,并通过多层感知机获得两个高参数值。然后,可以通过较低的残留块和上取样(解码阶段)获得转换后的生成图像。

步骤11)接下来是鉴别器模块的设计。鉴别器模块的结构与生成器的结构大致相似。

步骤12)歧视者的结构由全球歧视者和地方歧视者组成。

步骤13)连接全局歧视者和本地歧视者的输出结果。

步骤14)设计损失功能。损失功能包括四个部分:一个是与损失作斗争;另一个是循环损失。为了避免生成器和鉴别器在找到一定的平衡后相互对帐并停滞不前,有必要确保仍然可以返回为目标字段生成的图像。它在源字段中被识别,因此为发电机添加了对循环一致性的约束。第三是身份损失。为了确保输入图像和输出图像的颜色分布相似,身份一致性约束将添加到生成器中。这是为了确保从目标字段选择图像以及从源字段到目标字段的翻译,理论上不应改变;第四,CAM丢失,给出一个激活图,发电机必须能够知道要升级的位置意味着发电机需要知道源域和目标域之间的当前最大差异在哪里。

步骤15)将带有最多样品数量的透明塑料瓶放入训练集A中,然后将需要放大的样品(例如紫色塑料瓶)放入训练集b。训练之前,复制原始的紫色塑料瓶。具有与培训集相同的数据量。

步骤16)设置了参数之后,例如学习率,迭代编号和保存权重文件的路径,开始培训。

步骤17)在训练过程中,随着迭代次数的增加,发生器损失和鉴别损失值趋向于平衡状态。

步骤18)将所有透明的塑料瓶放入测试套件中,并在测试集b中放置几个​​紫色塑料瓶图像。测试的目的是获得从透明塑料瓶中转换的紫色塑料瓶的图像。

步骤19)最后,获得现实的生成结果。遵循相同的步骤获得紫色,红色,绿色和其他类别的合成塑料瓶。

在步骤4)中,编码器的图像输出的不同通道结合了图像的不同特征,图像的特征向量IE,编码是根据这些特征将源域从源域转换为目标域。

在步骤9)中,示例归一化更容易维护原始图像的语义信息,而不是层归一化,但是样式转换并不彻底。层归一化样式的转换更为彻底,但是它考虑了全局统计信息和语义信息不足。自适应归一化模块可以控制实例归一化和层归一化的比率,从而达到了两个归一化的合成的最佳效果,并指导模型在不通过注意力修改模型体系结构和超参数的情况下灵活控制。形状和纹理的变化量。

在步骤14)中,将发电机和鉴别器一起训练。训练两对发电机 - 歧视网络将图形从一个域转换为另一个域。这种转换过程需要满足循环一致性,即在串行应用发电机后,应获得与原始L1损耗相似的图像。因此,需要一个循环损耗函数,以确保生成器不会将一个域的图像转换为另一个域与原始图像完全无关的另一个域。使用两个循环损耗函数,以确保转换后的转换样式可以在反转后处理之前返回状态。

在第19步中,以透明的塑料瓶合成绿色塑料瓶为例。源域是一个透明的塑料瓶,目标域是一个绿色的塑料瓶,最终的合成结果是原始图像的第一行,即源域,第二行是合成源域透明的热图塑料瓶,第三行是产生的假透明塑料瓶,第四行是合成绿色塑料瓶的热图,第五行是合成的假绿色塑料瓶,六行是来自源域中的合成热图到目标域,然后到达源域,第七行是从源域到目标域,然后再到源域的合成图像。

上述实施方案是本发明的首选实施方案,但是本发明的实施方案不受上述实施方案的限制。任何其他变化,修改,替代,组合以及其他变化,修改,替代和组合不会偏离本发明的精神和原理。简化,两者都应是等效的替代方法,并包括在本发明的保护范围内。

网友留言(0)

评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。