¿Cómo clasificar y comprender las emociones de las personas que usan la jerga y los emoticonos de chat y mensajes de texto?

Estoy buscando artículos académicos revisados ​​por pares que analicen el procesamiento del lenguaje natural (PNL) que involucre la jerga/acrónimos de chat o mensajes de texto y el efecto de los participantes del chat en función del lenguaje y los emoticonos. ¿Alguien tiene una buena recomendación?

Ya estoy familiarizado con el trabajo reciente relacionado con el uso de Twitter para evaluar el estado de ánimo general de la sociedad como un medio para predecir el mercado de valores. Utilizaron el Perfil de Google de Estados de Ánimo (GPOMS) que mide el estado de ánimo como Calmado, Alerta, Seguro, Vital, Amable o Feliz. Estoy buscando otros ejemplos que evalúen el afecto general, idealmente aplicando pruebas psicométricas más científicas a la PNL.

No estoy tratando de usar los datos para la predicción. Busco usar algoritmos de aprendizaje automático para clasificar/categorizar conversaciones.

Referencias:

Bollen, J., Mao, H., Zeng, XJ. (2011). El estado de ánimo de Twitter predice el mercado de valores. Revista de Ciencias Computacionales, 2 (1), 1-8. [DOI]

Microsoft Cognitive Sciences tiene una API para esto, aunque creo que está pensada para palabras normales: text-analytics-demo.azurewebsites.net
Gracias @RJB. Lo comprobaré. Estos días también he descubierto Lexalytics

Respuestas (2)

El campo que está haciendo este trabajo que usted describe es el análisis de sentimientos . De Wikipedia:

Una tarea básica en el análisis de sentimientos es clasificar la polaridad de un texto determinado a nivel de documento, oración o característica/aspecto, ya sea que la opinión expresada en un documento, una oración o una entidad característica/aspecto sea positiva, negativa o neutral. La clasificación avanzada de sentimientos "más allá de la polaridad" analiza, por ejemplo, estados emocionales como "enojado", "triste" y "feliz".

De un curso introductorio (muchas buenas referencias en esta página)

Este trabajo se encuentra en el área general de análisis de sentimientos, extracción de opiniones o minería de opiniones y resumen de opiniones basado en características del contenido generado por el usuario o los medios generados por el usuario en la Web, por ejemplo, reseñas, foros y discusiones grupales, y blogs. En nuestro KDD-2004(Minqing Hu y Bing Liu. "Extracción y resumen de opiniones de clientes". Actas de la Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos, Seattle, Washington, EE. UU., 22-25 de agosto de 2004). Modelo de Minería de Opinión Basada, que ahora también se llama Minería de Opinión Basada en Aspectos (ya que el término característica aquí puede confundirse con el término característica utilizado en el aprendizaje automático). El resultado de dicha extracción de opinión es un resumen de opinión basado en características o un resumen de opinión basado en aspectos. El área también está relacionada con la clasificación de sentimientos. Nuestro trabajo actual se encuentra en dos áreas principales, que reflejan dos tipos de opiniones (o evaluaciones)

  • Minería de opiniones regulares (o directas). Ej: (1). Esta cámara es genial. (2). Después de tomar el medicamento, tuve dolor de estómago.
  • Minería de opiniones comparativas. Ejemplo: Coca-Cola sabe mejor que Pepsi.

En términos de sus objetivos reales, desplácese hacia abajo para obtener crédito adicional en esta página y encontrará un ejercicio que pasa por un escenario similar al que describe con los emoticonos.

En términos de revisión por pares, Chmiel A, Sienkiewicz J, et al (2011). Emociones colectivas en línea y su influencia en la vida comunitaria, PLoS One, 6(7), e22207. PDF _ Estoy seguro de que hay otros en las principales revistas de PNL, pero me falta una base de datos que los enumere.

Buscaría en el tema de la computación afectiva, especialmente en la detección y el reconocimiento de información emocional y luego me especializaría en métodos de PNL en esta área.

Aquí hay algunos artículos de interés:

Visualización de la estructura afectiva de un documento de texto

Un modelo de detección de afecto textual usando conocimiento del mundo real

Saurus: un diccionario de sinónimos cargado de emociones


Referencias:

Gouldstone, J., Liu, H., Lieberman, H., Ishii, H. (2006). Saurus: un diccionario de sinónimos cargado de emociones. Estética computacional: enfoques de inteligencia artificial para la belleza y la felicidad , Informe técnico WS-06-04.

Liu, H., Selker, T., Lieberman, H. (2003). Visualización de la estructura afectiva de un documento de texto. Actas de la Conferencia sobre Factores Humanos en Sistemas Computacionales , CHI 2003, 5-10 de abril de 2003, Ft. Lauderdale, Florida, Estados Unidos. ACM 2003, ISBN 1-58113-637-4, págs. 740-741.

Liu, H., Lieberman, H., Selker, T. (2003). Un modelo de detección de afecto textual utilizando conocimiento del mundo real. Actas de la Conferencia Internacional sobre Interfaces de Usuario Inteligentes de 2003, IUI 2003, 12 al 15 de enero de 2003, Miami, FL, EE. UU. ACM 2003, ISBN 1-58113-586-6, págs. 125-132. Miami, Florida.