Conecte-se conosco

Tecnologia

Integração de rótulos baseada em aumento de atributos para crowdsourcing

Publicado

em


Integração de rótulos baseada em aumento de atributos para crowdsourcing

Crédito: Fronteiras da Ciência da Computação (2022). DOI: 10.1007/s11704-022-2225-z

O crowdsourcing oferece uma maneira eficaz e de baixo custo de coletar rótulos dos trabalhadores coletivos. Devido à falta de conhecimento profissional, a qualidade dos rótulos crowdsourced é relativamente baixa. Uma abordagem comum para resolver esse problema é coletar vários rótulos para cada instância de diferentes trabalhadores coletivos e, em seguida, um método de integração de rótulos é usado para inferir seu verdadeiro rótulo. No entanto, quase todos os métodos de integração de rótulos existentes apenas fazem uso das informações de atributos originais e não prestam atenção à qualidade do conjunto de múltiplos rótulos ruidosos de cada instância.

Para resolver estas questões, uma equipe de pesquisa liderada por Liangxiao JIANG publicou sua nova pesquisa em Fronteiras da Ciência da Computação.

A equipe propôs um novo método de integração de rótulos de três estágios chamado integração de rótulos baseada em aumento de atributos (AALI). AALI melhora o desempenho da integração de rótulos, melhorando a capacidade discriminativa do espaço de atributos original e identificando a qualidade do conjunto de múltiplos rótulos ruidosos de cada instância. Resultados experimentais em conjuntos de dados simulados e de crowdsourcing do mundo real demonstram que a AALI supera todos os outros concorrentes de última geração em termos de qualidade de rótulo e qualidade de modelo.

Na pesquisa, eles projetam um método de aumento de atributos para enriquecer o espaço de atributos e, em seguida, desenvolvem um filtro para destacar instâncias confiáveis ​​​​com vários conjuntos de rótulos ruidosos de alta qualidade a partir de um conjunto de dados de crowdsourcing. Finalmente, eles usam a validação cruzada para construir classificadores de múltiplos componentes em instâncias confiáveis ​​para prever todas as instâncias.

No primeiro estágio, a AALI define as probabilidades de pertinência de classe geradas a partir de um conjunto múltiplo de rótulos ruidosos como novos atributos e constrói os atributos aumentados concatenando os atributos originais com os novos atributos. No segundo estágio, a AALI desenvolve um filtro para destacar instâncias confiáveis ​​com múltiplos conjuntos de rótulos ruidosos de alta qualidade. Como resultado, o conjunto de dados original é dividido em um conjunto de dados confiável e um conjunto de dados não confiável. Na terceira etapa, a AALI utiliza a votação por maioria para inicializar rótulos integrados de todas as instâncias em um conjunto de dados confiável, enquanto estima a certeza de cada rótulo integrado e atribui-a ao peso de cada instância.

Em seguida, AALI usa validação cruzada K-fold para construir classificadores de componentes M em conjuntos de dados confiáveis ​​para prever distribuições de probabilidade de classe de todas as instâncias. Por fim, a AALI atualiza o rótulo integrado de cada instância no conjunto de dados confiável e atribui o rótulo integrado a cada instância no conjunto de dados não confiável. Os extensos resultados experimentais em conjuntos de dados simulados e de crowdsourcing do mundo real validam a superioridade da AALI.

Trabalhos futuros podem se concentrar em encontrar o valor ideal do limite do filtro desenvolvido usando um método de otimização.

Mais Informações:
Yao Zhang et al, Integração de rótulos baseada em aumento de atributos para crowdsourcing, Fronteiras da Ciência da Computação (2022). DOI: 10.1007/s11704-022-2225-z

Fornecido por Frontiers Journals

Citação: Integração de rótulo baseada em aumento de atributos para crowdsourcing (2023, 30 de outubro) recuperado em 30 de outubro de 2023 em https://techxplore.com/news/2023-10-attribute-augmentation-based-crowdsourcing.html

Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.

techxplore.com




Clique para comentar

Deixe um Comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

+ ACESSADAS DO MÊS