OPPO recebe oito prêmios no CVPR 2023

Nota: O seguinte artigo irá ajudá-lo com: OPPO recebe oito prêmios no CVPR 2022

A Conferência Anual de Visão Computacional e Reconhecimento de Padrões (CVPR) chegou ao fim em Nova Orleans, com a empresa líder global em tecnologia OPPO tendo sete de seus trabalhos submetidos selecionados para a conferência, colocando-a entre as empresas de tecnologia de maior sucesso no evento. A OPPO também se classificou em oito dos eventos de competição amplamente assistidos na conferência, levando para casa três prêmios de primeiro lugar, um segundo lugar e quatro terceiros lugares.

“Em 2012, redes neurais profundas projetadas para reconhecimento de imagem rejuvenesceram a pesquisa e a aplicação da inteligência artificial. Desde então, a tecnologia de IA ou por uma década de rápido desenvolvimento.” disse Guo Yandong, cientista-chefe em percepção inteligente da OPPO.

“A OPPO continua a promover a inteligência artificial para realizar comportamentos perceptivos e cognitivos complexos. Capacitamos a IA com habilidades cognitivas mais altas para entender e criar beleza e desenvolver IA incorporada com comportamento autônomo. Estou muito feliz em ver que sete de nossos artigos foram selecionados para a conferência deste ano. Com base nesse sucesso, continuaremos a explorar a IA fundamental e a tecnologia de IA de ponta, bem como os aplicativos comerciais que nos permitirão levar os benefícios da IA ​​a mais pessoas”.

Os sete artigos aceitos pelo CVPR 2022 mostram o progresso da OPPO na criação de IA humanizada

Sete trabalhos submetidos pela OPPO para o CVPR 2022 foram selecionados para apresentação na conferência. Suas áreas de pesquisa incluem interação multimodal de informações, reconstrução 3D do corpo humano, avaliação estética de imagem personalizada, destilação de conhecimento e outras.

A inovação modular cruzada é vista como o caminho para ‘humanizar’ a inteligência artificial. Os dados de texto geralmente incluem um grau elevado de simplificação excessiva, enquanto os dados de imagem visual contêm muitos detalhes contextuais específicos. Os pesquisadores da OPPO propam uma nova estrutura CRIS baseada no modelo CLIP para permitir que a IA obtenha uma compreensão mais detalhada dos dados modais de texto e imagem.

A maior diferença entre inteligência humana e artificial hoje está na multimodalidade. Os seres humanos podem, sem dúvida, descobrir dados em palavras e imagens e estabelecer relações entre os dois tipos de dados. O novo método proposto pela OPPO melhora a inteligência multimodal, o que poderia levar a inteligência artificial a realmente entender e interpretar o mundo por meio de múltiplas formas de informação, como linguagem, audição, visão e outras, tornando o robô e os assistentes digitais da ciência -fi filmes se tornam realidade.

A reconstrução do corpo humano em 3D é mais uma região na qual o Instituto de Pesquisa OPPO fez progressos significativos. Na CVPR, a OPPO demonstrou um processo para gerar automaticamente avatares digitais de humanos com roupas que se comportam de forma mais natural. Ao analisar o vídeo RGB de humanos capturados com uma câmera, o modelo OPPO pode gerar com precisão modelos dinâmicos 1:1 3D que incluem pequenos detalhes como logotipos ou texturas de tecido. Criar modelos 3D precisos de roupas continua sendo um dos maiores desafios. O novo modelo reduz efetivamente os requisitos necessários para realizar a reconstrução 3D do corpo humano, fornecendo fundamentos técnicos que podem ser aplicados a áreas como vestiários virtuais para compras on-line, instrução de condicionamento físico de IA e criação de avatares realistas em mundos VR/AR.

O reconhecimento de imagem de IA atingiu agora um estágio em que pode identificar com precisão uma ampla variedade de objetos em uma imagem. A capacidade da IA ​​de avaliar imagens em termos de qualidade estética percebida geralmente está fortemente relacionada ao big data usado no treinamento do modelo de IA.

Em colaboração com Leida Li, uma professora da Universidade de Xidian propôs o modelo de Avaliação de Estética de Imagem Personalizada (PIAA). O modelo é o primeiro a otimizar a avaliação estética da IA, combinando as preferências subjetivas dos usuários com valores estéticos mais generalizados. No futuro, o modelo será usado para criar experiências personalizadas para os usuários, não se limitando apenas à curadoria de álbuns de fotos, mas também fornecerá recomendações sobre como tirar a melhor foto e qual conteúdo um usuário pode preferir.\

Avaliação de estética de imagem personalizada com atributos avançados

A OPPO também optou por tornar o conjunto de dados de avaliação do modelo PIAA o código aberto para desenvolvedores, com várias instituições de pesquisa e universidades já manifestando interesse em usar os dados para promover seus próprios esforços na avaliação estética personalizada da IA.

Além disso, a OPPO também propôs uma solução de reconstrução de plano semântico 3D multi-view capaz de analisar com precisão superfícies dentro de um ambiente 3D. Desenvolvido em parceria com a Universidade de Tsinghua, o INS-Conv (INcremental Sparse Convolution) pode alcançar uma segmentação de instância e semântica 3D online mais rápida e precisa. Isso pode reduzir efetivamente o poder de computação necessário para realizar o reconhecimento do ambiente, o que permitirá que essa tecnologia seja mais facilmente adotada em aplicativos como direção automatizada e VR.

OPPO torna a IA ‘leve’ com a vitória em segundo lugar no NAS Challenge

O CVPR 2022 também viu vários desafios técnicos, com a OPPO ficando em terceiro lugar e acima em oito desafios. Estes incluem o desafio de pesquisa de arquitetura neural (NAS), SoccerNet, SoccerNet Replay Grounding, localização temporal ActivityNet, o 4º Desafio de Segmentação de Objetos de Vídeo em Grande Escala.

Da fotografia móvel à condução automatizada, os modelos de aprendizado profundo estão sendo aplicados em um conjunto cada vez maior de setores. No entanto, o aprendizado profundo depende muito de big data e poder de cálculo e consome muito custo, os quais apresentam desafios para sua implementação comercial. As técnicas de pesquisa de arquitetura neural (NAS) podem descobrir e implementar automaticamente arquiteturas de rede neural ideais. Na competição NAS, os pesquisadores da OPPO treinaram uma super-rede de 45.000 redes subneurais para herdar os parâmetros da super-rede otimizando o modelo.

Usando a técnica NAS, os pesquisadores só precisam treinar uma grande super-rede e criar um preditor para permitir que as sub-redes aprendam herdando os parâmetros da super-rede. Isso fornece uma abordagem eficiente e de baixo custo para obter um modelo de aprendizado profundo que supera aqueles projetados manualmente por arquitetos de rede especializados. Isso acabará trazendo níveis anteriormente impensáveis ​​de tecnologia de IA para dispositivos móveis em um futuro próximo.

Durante o VR 2022, a OPPO também participou de apresentações de seminários e três workshops de alto nível. No seminário SLAM, o pesquisador da OPPO, Deng Fan, compartilhou como o vSLAM em tempo real pode ser executado em smartphones e dispositivos AR/VR. No AICITY Workshop, Li Wei propôs um sistema de localização de movimento baseado em múltiplas visualizações para identificar o comportamento anormal dos motoristas durante a condução.

OPPO está trazendo os benefícios da IA ​​para mais pessoas, mais cedo

Este é o terceiro ano que a OPPO participa da CVPR. O crescente sucesso da OPPO na CVPR durante esses três anos se deve muito ao seu investimento contínuo em tecnologia de IA. No início de 2020, o Instituto de Percepção e Interação Inteligente foi estabelecido sob o Instituto de Pesquisa OPPO para aprofundar ainda mais a exploração de tecnologias de IA de ponta da OPPO. Hoje, a OPPO tem mais de 2.650 pedidos de patentes globais no campo da IA.

Guiada por sua proposta de marca, ‘Inspiration Ahead’, a OPPO também está trabalhando com parceiros de todo o setor para levar a tecnologia de IA do laboratório para a vida cotidiana. A tecnologia de IA da OPPO também foi usada para desenvolver produtos e recursos como o gerador de AR espacial em tempo real CybeReal, OPPO Air Glass, Omoji e muito mais. Por meio dessas tecnologias, a OPPO visa criar mundos digitais mais realistas que combinam virtual e realidade para criar experiências totalmente novas para os usuários.

Table of Contents