Sistemas de recomendações baseadas em conteúdo

Pesquisa sobre 007 Contra SPECTRE (2015), feita no dia 19-09-25, na barra do Google.

O objetivo deste post

Este post, da série especial sobre Sistemas de Recomendação, trata do tipo de recomendação feita com base no conteúdo dos itens pesquisados por visitantes de sites, lojas digitais, e-commerce, mídias sociais, aplicativos, entre outros espaços virtuais. O objetivo, aqui, é dar uma ideia inicial do que esse tipo de sistema de recomendação pode fazer pelo seu negócio, sem a pretensão de esgotar o tema.

Exemplo prático de uma recomendação baseada em conteúdo

Imagine este cenário. Você acaba de entrar no site do Google e pesquisar sobre "007 Contra Spectre". Considere que, neste momento, o Google não está interessado em quem é você, mas no item que você pesquisou. Ele, então, assume que se trata do filme de 2015, com Daniel Craig no papel de James Bond, e recomenda uma série de outros filmes similares, geralmente, por ordem de relevância.

Pelo resultado na foto acima, você pode ver que as sugestões feitas foram os outros quatro filmes de 007 encabeçados pelo mesmo ator (parte do elenco desses filmes também é a mesma do filme pesquisado). Quanto a quinta sugestão, Missão Impossível - Efeito Fallout (2018), trata-se de um filme liderado por um outro espião de atuação global, Ethan Hunt. 

Se você pesquisar no site da IMDb, por exemplo, verá que o filme de Daniel Craig e o filme de Tom Cruise têm gêneros categorizados de, pelo menos, cinco formas idênticas: "Espião", "Ação", "Suspense", "Aventura" e "Aventura de Viajar pelo Mundo". Classificações como essas podem justificar o fato do Google, ao fazer os cálculos matemáticos de similaridades entre filmes, ter descoberto que o título da trupe de Hunt|Cruise tem mais coisas em comum com o da trupe de Bond|Craig do que os dos 007s anteriores (com Sean ConneryRoger MoorePierce Brosnan no papel do espião britânico).

É possível que, daqui a alguns dias ou algumas horas, você faça a mesma pesquisa no Google e receba resultados diferentes desse exibido acima. Isso acontece porque os sistemas de recomendação — de forma geral — dependem dos dados, regras e algortimos que recebem para fazerem os cálculos matemáticos de similaridades, bem como da frequência com que são atualizados. 

Para ilustrar isso, veja o que aconteceu com a pesquisa do mesmo filme feita através de um outro modelo de recomendação baseada em conteúdo:

Resultado do modelo desenvolvido pela autora, usando dados de filmes lançados até 2015 (o mesmo ano do filme 007 Contra SPRECTRE).

Neste segundo caso, o sistema foi construído usando dados de filmes lançados até 2015 e características como "resumo do filme" e "palavras-chave". Escolhas como essas contribuiram para o modelo sugerir 007 Contra Skyfall, com Craig no papel de Bond, na primeira posição; e 007 - Nunca Mais Outra Vez (1983), na segunda posição. 

O sistema calculou que o filme liderado pelo James Bond de Sean Connery tem mais relação com 007 Contra SPECTRE do que o outro filme com Craig, 007 - Quantum of Solace (2008), que ocupou a terceira posição no ranking de similaridade. Quem assistiu esses 3 filmes sabe que o Bond de Connery teve que lidar diretamente com a SPECTRE, tal como acontece com o Bond de Craig no filme de 2015. Interessante, não e?

Ok! E o que isso tem a ver com você e seu negócio online?

Bem, o processo de criação dos sistemas de recomendação de filmes é parecido com os dos demais tipos de produtos, serviços, conteúdo ou itens publicados online com a intenção de que sejam consumidos por quem se interessou por eles o bastante para fazer uma pesquisa. Muito vai depender dos dados que você já possui e do que você deseja atingir com a implantação desse sistema, por exemplo, aumentar as suas vendas, de preferência, obtendo lucro com isso.

E como esse sistema de recomendação com base em conteúdo funciona?

Todo produto, serviço ou item possui metadados que o identifica: uma definição (por exemplo, vestido), uma marca (C&A, Zara, Chanel), categorias (preço popular, preço premium, verão, inverno, tamanho), a sua composição (algodão, viscose, seda), para quem ele é mais indicado (mulher, criança, jovem, adulto, idoso), origem da produção (Brasil, China, Bangalore, França, Itália) e assim por diante.

Com base em informações como essas, você pode ter um modelo de recomendação baseado nas características de cada item que sua empresa comercializa e colocá-lo para funcionar em sua loja virtual.

Qual é uma das principais vantagens da recomendação baseada em conteúdo?

O sistema de recomendação baseado em conteúdo não necessita, obrigatoriamente, dos dados dos usuários para funcionar, e sim dos dados dos itens (produtos, serviços). Ele resolve o seu problema de negócio de querer recomendar algo mais — além do item pesquisado — para a pessoa que navegou e pesquisou por algo em seu site ou loja. Assim sendo, você vai entregar mais coisas similares ao que ela deseja ver naquele momento, ampliando o seu leque de oportunidades de fazer negócio com ela.

Qual é uma das limitações da recomendação baseada em conteúdo?

Este não é, exatamente, um sistema de recomendação personalizado, justamente por você não ter (ou não poder usar, por qualquer que seja o motivo) as informações de consumo abertas por usuário ou as avaliações dadas por ele aos seus produtos ou serviços. Em outras palavras, este modelo não considera os gostos e preferências dessa pessoa; ele só entende que, se ela quer, por exemplo, o filme 007 Contra SPECTRE, ela — provavelmente — vai gostar de outros filmes similares a ele (como você não sabe se isso é verdade ou não, pode ser que você não faça negócios adicionais com ela).

Algumas considerações que você precisa ter em mente antes de implantar um sistema de recomendação baseada em conteúdo.

Você precisa decidir, antecipadamente, quais características dos seus produtos ou serviços são, realmente, relevantes para o público do seu negócio. Não se trata de colocar todos os metadados existentes para fazer o modelo de recomendação funcionar, mas de colocar aqueles que poderão impactar a escolha do seu cliente em potencial.

Dados demais podem afetar tanto o custo da implantação do seu sistema (exigindo maior tempo de execução e capacidade computacional, mesmo que na nuvem) como impossibilitá-lo de encontrar semelhanças — relevantes — entre os itens existentes, visto que recebeu tanta informação que não consegue calcular a similaridade adequada entre os itens.

Espero que estas informações preliminares possam te ajudar a entender melhor como um sistema de recomendação baseada em conteúdo funciona e algumas de suas vantagens e limitações. Como mencionei antes, o objetivo deste post não é esgotar o tema, mas dar uma ideia do que ele pode fazer pelo seu negócio. Voltarei a esse assunto, em outros posts, no futuro.

Próximo post

Seguindo a ordem da série especial sobre Sistemas de Recomendação, o próximo post tratará dos modelos criados usando Filtros Colaborativos e como eles podem beneficiar o seu negócio. 

Aguarde!

Comentários

Postagens mais visitadas deste blog

Como usar Sistemas Híbridos para personalizar recomendações e aumentar vendas

Sistemas de recomendações usando análises de cestas de compras

Sistemas de recomendações com filtros colaborativos