Patente Google: atributos subjetivos
En mayo de 2022, Google concedió la patente «Identifying subjective attributes by analysis of curation signals» (US 11.328.218). Describe cómo los sistemas de búsqueda derivan rasgos subjetivos de entidades —como «divertido», «mono» o «awesome»— a partir de reacciones en la web y los predicen para contenido nuevo. Para equipos SEO, esto es más que curiosidad patentaria: une comprensión de entidades, contenido generado por usuarios (UGC) y aprendizaje automático en un modelo de señales claro.
Por qué importan los atributos subjetivos para Google
Los hechos objetivos de una entidad —nombre, fecha, dirección— no bastan para la búsqueda moderna. Los usuarios describen medios, marcas o lugares de forma emocional y subjetiva. La patente cubre esa brecha: define un vocabulario de atributos subjetivos y los asigna a entidades que van desde clips y artículos de blog hasta personas y empresas. Puntuaciones de relevancia entre 0,0 y 1,0 miden qué tan fuerte encaja un atributo —por ejemplo si «cute» aparece en la mitad de los comentarios de un vídeo.
UGC como fuente central de datos
Un bloque crítico es el contenido generado por usuarios. Google cita comentarios en redes sociales, reacciones en blogs, reseñas de productos y películas y señales no textuales como like, dislike, +1, compartir, marcadores o listas de reproducción. Esas señales de curación aportan los datos brutos para extraer primeros conjuntos de atributos. Cuanto más se extiende el UGC, más relevante es esta lógica patentada para evaluar contenido sin densidad clásica de palabras clave.
- Comentarios y reseñas textuales
- Likes, shares y marcadores
- Visibilidad en playlists y feeds
- Ponderación por autoridad del usuario
De la señal al clasificador entrenado
El flujo sigue un patrón repetible: primero un «Subjective Attribute Identifier» extrae atributos de reacciones. Un «Relevancy Scorer» calcula frecuencias y descarta coincidencias débiles —a menudo solo quedan los k atributos más fuertes. En paralelo, un extractor de características genera vectores de color, textura, audio, frecuencias de palabras o metadatos. Google entrena clasificadores como SVM, AdaBoost, redes neuronales o árboles de decisión. Tras el entrenamiento, se pueden predecir atributos para entidades nuevas sin comentarios —vídeos recién subidos o artículos sin interacción.
Datos de la patente
| Campo | Dato |
|---|---|
| Número de patente | US 11.328.218 |
| Concedida | 10 de mayo de 2022 |
| Presentada | 6 de noviembre de 2017 |
| Titular | Google LLC |
Arquitectura del sistema y almacenamiento
La arquitectura incluye servidores, un almacén de entidades y clientes en redes públicas o privadas. El almacén guarda medios, páginas y reseñas; un gestor de atributos subjetivos enlaza servidor web, identificador, scorer, extractor y clasificador. Los usuarios pueden elegir qué datos se recopilan —un aviso sobre privacidad en personalización basada en atributos.
Mapeos inversos y usos en búsqueda
Tras procesar muchas entidades surge un mapeo inverso: ¿qué objetos tienen el atributo «funny»? Eso acelera búsquedas por palabra clave, playlists, anuncios y nuevos datos de entrenamiento. Para editores, etiquetas y descripciones alineadas con el lenguaje del usuario ayudan en superficies basadas en atributos —no solo con meta keywords clásicas.
Entidades físicas vía proxies digitales
Restaurantes, actores o negocios locales a menudo no tienen UGC en su dominio. La patente permite evaluar fanpages, portales de reseñas o señales agregadas de feeds; los atributos subjetivos siguen ligados a la entidad real. Para SEO local y reputación, las señales de terceros alimentan el modelo de entidades de Google, no solo el texto on-page.
Puntuaciones de relevancia y vocabulario
La patente detalla cómo se construyen las puntuaciones: frecuencia en comentarios, peso de usuarios concretos y umbrales deciden qué atributos permanecen en una entidad. Una puntuación entre 0,0 y 1,0 puede reflejar la proporción de comentarios con un término como «awesome». Los atributos débiles se descartan o se ponen a cero; a menudo solo quedan los k rasgos más fuertes. El vocabulario puede iniciarse manualmente y crecer con NLP a partir de nuevas reacciones —incluidos meta-atributos jerárquicos como «positivo» o «negativo».
Vectores de características más allá del texto
El clasificador no se alimenta solo de lenguaje. En vídeo e imagen importan color, textura e intensidad; en audio, amplitud y coeficientes espectrales; en documentos, frecuencias de palabras, longitud de frases y formato. Metadatos y bibliotecas externas pueden precalcular features. Así se estiman etiquetas subjetivas incluso con poco UGC —útil para guías nuevas, fichas de producto o fichas locales sin historial de reseñas.
Validación humana y reentrenamiento
Un segundo método sugiere atributos previstos al subidor; el usuario confirma, añade o elimina. Los atributos quitados se guardan como ejemplos negativos para reentrenar —por ejemplo cada 100 iteraciones. El modelo permanece ligado a la curación real, no solo a coincidencias automáticas de texto.
Práctica para SEO y estrategia de contenido
Quien optimiza visibilidad debe ver el UGC no solo como prueba social sino como input para etiquetas subjetivas de entidades. Comentarios auténticos, lenguaje coherente en reseñas y señales de reacción claras refuerzan la asignación. También convienen datos estructurados —metadatos, calidad de medio, estadísticas de texto— porque el clasificador opera sin UGC. La patente subraya que el SEO de entidades de Google va más allá del Knowledge Graph hacia semántica crowd y dimensiones emocionales predecibles.
Los inventores Hrishikesh Aradhye y Sanketh Shetty, con titular Google LLC, anclan la invención en el ecosistema de búsqueda. Quien use patentes como indicador temprano debería alinear calidad de comentarios, señales de engagement y etiquetas semánticas con objetivos de entidad —ya sea en noticias, vídeo o marcas locales.