Por trás dos algoritmos de recomendação
- Caio Gonzaga
- 7 de nov. de 2017
- 4 min de leitura
Sabe quando você termina um filme na Netflix e a plataforma te sugere outro (ou outros) títulos e você pode pensar “caramba, quero ver esse” ou “que saudades desse filme” ou até mesmo “gostei! vou colocar na minha lista de espera”?
Você acaba de interagir com o sistema de recomendação formado por algoritmos.
A intenção deste texto não é revelar o grande segredo por trás dos códigos. Nem dar uma aula sobre algoritmos. Nós não sabemos qual é o código que a Netflix usa para te sugerir filmes e séries mais “certeiros” possíveis, até porque a empresa retém a maioria das informações para defender sua estratégia comercial. Mas eu te conto tudo o que sabemos sobre ele.
Trabalho humano e manual
Engana-se quem pensa que o sistema de recomendação é totalmente automático.
Em 2015, a internet surtou quando a Netflix divulgou uma vaga de trabalho home office inédita para brasileiros. A descrição do emprego consistia basicamente em “assistir filmes e séries e categorizá-los”. Muitos portais de notícias afirmaram que “seria esse o emprego dos sonhos de muita gente”.
A oportunidade era para ocupar a vaga de tagger (em tradução aproximada, “classificador” ou “categorizador”).
O tagger tem por função assistir aos filmes e séries antes de serem disponibilizados na plataforma e classificá-los de acordo com alguns critérios e fornecer informações adicionais. Para isto, é desejado alguém com excelente habilidades analíticas, pois diferente do espectador comum, o tagger não pode deixar passar nenhuma “etiqueta” importante que ajudará o sistema a assimilar informações. Cada filme, série, desenho animado ou documentário chega a ter de 20 a 40 tags.
“Um tagger fica atento a detalhes que fazem toda a diferença na hora de categorizar e bolar recomendações para os assinantes”, explicou Todd Yellin, vice-presidente de inovação de produto da Netflix, em entrevista ao site Diário Catarinense “Por exemplo, se um determinado filme apresenta uma história simples ou complicada. É voltado para crianças? É para crianças com menos de 10 anos ou mais? É uma animação? É uma animação com animais? Esses animais falam? Há fumo, bebida, nudez? Se sim, que tipo e quanto de nudez aparece? Há violência? Que tipo e quanto de violência?”
Após a parte de categorização feita pelos taggers ao redor do mundo, os algoritmos entram em ação e tentam cruzar as informações.
A consagração da Netflix
A série “Stranger Things”, criada pelos irmãos Duffer em 2016 para a Netflix, ficou mundialmente conhecida após seu lançamento e chegou a ser a série mais popular do IMDB - sigla que significa Base de Dados de Filmes da Internet (em Inglês: Internet Movie Database), um dos mais respeitados sites de crítica popular de Filmes e Séries do mundo - ultrapassando megaproduções como Game of Thrones (HBO).
Gustavo Miller, digital creative, publicou uma notória teoria no Linkedin que traz à tona os conceitos de Big Data. “Seria ‘Stranger Things’ uma obra de arte do algoritmo da Netflix?”, pergunta ele. Assim como “House Of Cards”, a série foi desenvolvida com base na análise comportamental dos usuários, ou seja, nós dissemos à Netflix o que gostaríamos de ver numa nova produção. “Stranger Things” costurou “ET” com “Contatos imediatos do terceiro grau”, “Goonies” com “Poltergeist”, além de outras referências. E foram colocados no elenco principal atores populares da década de 1980: Winona Ryder e Matthew Modine.
Meses depois, a Netflix confirmou a segunda temporada da série em meio a muito sucesso da nova “queridinha” do streaming.
Os códigos na prática
Tentando traduzir, a ideia do sistema de recomendação é te dizer “Se você gostou desse, vai adorar este outro”. E ele faz isso a partir de análises de métricas de comportamento. Isso quer dizer que tudo o que você faz na plataforma é analisado e se transforma num dado que pode expressar uma tendência ou desejo.
Não tem nada a ver com a sua idade ou com o lugar onde você mora, também não tem a ver com o seu gênero. As únicas informações que importam são seus gostos e preferências.
Os assinantes são agrupados em “clusters“, ou comunidades globais, definidas quase que exclusivamente por seu gosto em comum. As páginas iniciais dos usuários de cada comunidade são preenchidas por uma pequena fatia de conteúdo que a maior parte do grupo já assistiu ou gosta.
Logo que você começa a usar o Netflix, você ou uma pessoa na Coreia do Sul podem ter a home bem parecidas, mas conforme o algoritmo vai reconhecendo seus gostos e preferências, tudo muda.
Gisele Silva, Cientista da Computação, explica como os sistemas de recomendação são formadas e onde podemos encontrá-los. Assista!
No final, o código nunca é uma ciência exata, e dois usuários nunca terão a mesma página inicial. É por isso que muitos preferem criar mais contas, um para cada gênero ou preferência, tendo mais alcance na biblioteca. Quanto mais programas você assiste, mais você se encaixa em uma comunidade, o que ajuda a Netflix a te sugerir aquilo que pessoas com gostos semelhantes aos seus assistem. Se muitas pessoas que assistem “comédia” assistem determinado filme de ação, esse filme vai ser sugerido para quem assiste a mesma fatia de produtos. Além das produções assistidas, as suas pesquisas e notas também influenciam o código. O número de estrelas que você dá pra um programa faz com que o algoritmo te conheça mais e possa bloquear filmes e séries semelhantes àqueles que você não gostou. Atores, diretores e produtores também são levados em conta. Suponhamos que você assista a alguma produção do Jim Carrey e avalie com apenas duas estrelas. É provável que outro filme do ator não vá aparecer tão cedo na sua homepage. Agora, se você constantemente pesquisa por nomes de diretores ou filmes consagrados, a Netflix vai lembrar disso e te sugerir vários filmes do Quentin Tarantino – a não ser que você tenha dado uma nota péssima para “Kill Bill Vol. 2”. Através do exemplo da Netflix, percebemos que, nessa era cada vez mais mais digital, os perfis de consumidores não podem ser resumidos em informações simples como gênero, idade ou localização. A nova configuração de público requer que as empresas entendam o que realmente interessa para a audiência e saia do “arroz com feijão de cada dia”. É necessário ir além.
Comments