Tecnologia
Integração de rótulos baseada em aumento de atributos para crowdsourcing
O crowdsourcing oferece uma maneira eficaz e de baixo custo de coletar rótulos dos trabalhadores coletivos. Devido à falta de conhecimento profissional, a qualidade dos rótulos crowdsourced é relativamente baixa. Uma abordagem comum para resolver esse problema é coletar vários rótulos para cada instância de diferentes trabalhadores coletivos e, em seguida, um método de integração de rótulos é usado para inferir seu verdadeiro rótulo. No entanto, quase todos os métodos de integração de rótulos existentes apenas fazem uso das informações de atributos originais e não prestam atenção à qualidade do conjunto de múltiplos rótulos ruidosos de cada instância.
Para resolver estas questões, uma equipe de pesquisa liderada por Liangxiao JIANG publicou sua nova pesquisa em Fronteiras da Ciência da Computação.
A equipe propôs um novo método de integração de rótulos de três estágios chamado integração de rótulos baseada em aumento de atributos (AALI). AALI melhora o desempenho da integração de rótulos, melhorando a capacidade discriminativa do espaço de atributos original e identificando a qualidade do conjunto de múltiplos rótulos ruidosos de cada instância. Resultados experimentais em conjuntos de dados simulados e de crowdsourcing do mundo real demonstram que a AALI supera todos os outros concorrentes de última geração em termos de qualidade de rótulo e qualidade de modelo.
Na pesquisa, eles projetam um método de aumento de atributos para enriquecer o espaço de atributos e, em seguida, desenvolvem um filtro para destacar instâncias confiáveis com vários conjuntos de rótulos ruidosos de alta qualidade a partir de um conjunto de dados de crowdsourcing. Finalmente, eles usam a validação cruzada para construir classificadores de múltiplos componentes em instâncias confiáveis para prever todas as instâncias.
No primeiro estágio, a AALI define as probabilidades de pertinência de classe geradas a partir de um conjunto múltiplo de rótulos ruidosos como novos atributos e constrói os atributos aumentados concatenando os atributos originais com os novos atributos. No segundo estágio, a AALI desenvolve um filtro para destacar instâncias confiáveis com múltiplos conjuntos de rótulos ruidosos de alta qualidade. Como resultado, o conjunto de dados original é dividido em um conjunto de dados confiável e um conjunto de dados não confiável. Na terceira etapa, a AALI utiliza a votação por maioria para inicializar rótulos integrados de todas as instâncias em um conjunto de dados confiável, enquanto estima a certeza de cada rótulo integrado e atribui-a ao peso de cada instância.
Em seguida, AALI usa validação cruzada K-fold para construir classificadores de componentes M em conjuntos de dados confiáveis para prever distribuições de probabilidade de classe de todas as instâncias. Por fim, a AALI atualiza o rótulo integrado de cada instância no conjunto de dados confiável e atribui o rótulo integrado a cada instância no conjunto de dados não confiável. Os extensos resultados experimentais em conjuntos de dados simulados e de crowdsourcing do mundo real validam a superioridade da AALI.
Trabalhos futuros podem se concentrar em encontrar o valor ideal do limite do filtro desenvolvido usando um método de otimização.
Mais Informações:
Yao Zhang et al, Integração de rótulos baseada em aumento de atributos para crowdsourcing, Fronteiras da Ciência da Computação (2022). DOI: 10.1007/s11704-022-2225-z
Fornecido por Frontiers Journals
Citação: Integração de rótulo baseada em aumento de atributos para crowdsourcing (2023, 30 de outubro) recuperado em 30 de outubro de 2023 em https://techxplore.com/news/2023-10-attribute-augmentation-based-crowdsourcing.html
Este documento está sujeito a direitos autorais. Além de qualquer negociação justa para fins de estudo ou pesquisa privada, nenhuma parte pode ser reproduzida sem permissão por escrito. O conteúdo é fornecido apenas para fins informativos.
techxplore.com
-
Notícias3 semanas atrás
Flávio Dino receberá medalha do Mérito Naval da Marinha
-
Política2 semanas atrás
Orçamento do governo Lula para obras em universidades é um dos piores; entenda
-
Política3 semanas atrás
Ministra defende retomada do PL das Fake News, engavetado por Lira
-
Notícias3 semanas atrás
Dengue: Deputado pede demissão de ministra da Saúde de Lula
-
Política3 semanas atrás
Novo vai ao TCU pedir anulação da megalicitação do governo
-
Saúde6 dias atrás
Brasil ultrapassa marca de 2,5 mil mortes por dengue em 2024