Hola, soy Mariluz Congosto, investigadora de datos sociales. Pregúntame

Enviado por congosto el 16 de abril de 2019

Hola, soy Mariluz Congosto, investigadora de datos sociales. En el año 2016 defendí mi tesis sobre “Caracterización de usuarios y propagación de mensajes en Twitter en el entorno de temas sociales”. Tengo un blog que se llama Barriblog en el que voy publicando muchos casos que he ido analizando desde el año 2009 como Ley Sinde, el 15M, 25S, las campañas electorales desde la catalanas del 2010. También tengo un barómetro social (t-hoarder.com/) con las reacciones ante los recortes o los escándalos sobre Banquia, Bárcenas, Urdangarín, Puyol, Caso Arena, etc.. y el proyecto metroavías (t-hoarder.com/metro_madrid/) para medir las quejas del metro de Madrid. Martes 16 de abril a las 12:00h.



#5 alvaro_maricio

Hola Mariluz, muy interesante tu trabajo, hablando un poco de ciencia ficción, ¿Te has leído la trilogía de la fundación de Isaac Asimov? En libro se inventan el concepto de psicohistoria, que a grandes rasgos consiste en predecir el futuro de la humanidad a partir de calculos estadísticos, esto se logra solamente cuando se tiene información de una “masa crítica" mínima de población, 75 billones, y que esta no esté al tanto de que se le está aplicando este análisis.

Partiendo de todo esto, me gustaría saber, ¿Consideras de que existe alguna “masa critica" en las redes sociales en la que una idea (independiente de su veracidad) sea capaz de moldear el comportamiento de la población a la que esta se está exponiendo? Además, una vez una población ha tomado conciencia de que se le está intentando moldear su opinión, ¿Existe algún "efecto rebote" que lleve a esta a pensar diferente o justo lo contrario?
Espero no suene a tontería lo que he preguntado , gracias por leer.

Soy fan de la trilogía, de hecho creo que analizo dato sociales por su influencia. El uso de la psicohistoria era positivo, para salvar a la humanidad, no para manipular. Escribí algo de esto www.barriblog.com/2016/07/esperando-a-hari-seldon/. Respecto a lo que dices de moldear opinión, tenemos casos muy recientes en pasadas elecciones y referéndum con resultados sorpresa. En España están proliferando los bulos xenófobos y en algunos casos se ha detectado una coordinación internacional para lanzarlos. El bombardero de información falsa puede llegar a personas que se lo creen todo y que pueden ser influenciadas. La única reacción es tener espíritu crítico y evitar la difusión de noticias sospechosas y denunciar los bulos cuando nos llegan por redes sociales o mensajería instantánea


#6 PasaPollo

Hola, Mariluz, gracias por participar. ¿Hasta qué punto es errado (o acertado) predecir la percepción social española en base a la actividad en Twitter? ¿Qué disonancia existe con respecto a otros resultados, como los de las elecciones o el CIS?

Con Twitter no se puede predecir porque no hay una base demográfica amplia y uniforme. Los usuarios no están segmentados porque la información del perfil es muy escasa. Además, hay mucho ruido de automatismos, perfiles falsos, sobreactuación o silencio de ciertas ideologías. No vale para hacer modelos predictivos pero se puede medir el pulso social ante los acontecimientos. Para ver que se habla (de fútbol, te lo digo yo) , qué nos preocupa más. Lo de predecir las elecciones es una fantasía que aún no ha dado sus frutos


#1 sangaroth

Hola Mariluz, desconociendo tu área de trabajo creo entender que vas colectando->procesando->visualizando datos de 'opinión' para su posterior análisis. Recientemente descubrí la figura de Edward Bernays y todavía estoy alucinado con sus 'logros'; cambiar percepciones (construcciones de la 'realidad') y patrones de consumo de una sociedad entera. Lo que me fascina y aterra a partes iguales es cuan influenciables somos (como conjunto, sociedad) y lo sofisticado y estudiado que están las 'generaciones de opinión'. ( no un estamos influenciados!, sino un joder!!!!!! realmente somos muy borregos! y nos llevan por donde quieren a niveles que no creía posibles)
Casos como Cambridge Analytica dan mucho que pensar, ¿estamos jodidos o crees que hay esperanza de algún modo para la humanidad?
Gracias,

El contenido del mensaje se potencia con la facilidad de colocarlo en segmentos muy definidos como en el caso de Cambridge Analytica. Estamos muy expuestos a la manipulación, pero somos nosotros los que nos exponemos voluntariamente y entregamos todos nuestros datos. La única salvación es que seamos conscientes de ello y cambiemos de hábitos. La educación digital y el espíritu crítico es lo único que nos permitirá escapar de la manipulación. Quiero ser optimista y pensar que nos adaptaremos y sobreviviremos


#4 Saigesp

Buenas Mariluz! Un placer verte por aquí también.

Ahora que no estamos en Twitter... ¿Qué tal tu relación con Twitter España? Por lo que suelo ver parece que no te hacen mucho caso cuando denuncias granjas de bots, astroturfing y otras prácticas. ¿Crees que es intencionadamente, que no dan abasto...?

También, ¿Qué tal la relación con los partidos políticos? ¿Has tenido alguna confrontación con alguno? (No hablo de seguidores, sino de las propias estructuras)

Y ya por último, tengo curiosidad por tu política de no revelar nombres, o cuentas que están detrás de otras cuentas (caso @Anonymus_ES por ejemplo). Si pudieses explicarnos los motivos te lo agradecería, que seguro son interesantes.

Y nada, muchas gracias por tu trabajo! Eres una referencia!

Edit: Ah! Se me olvidaba. Si haces un grafo sobre tortilla con vs sin cebolla te ganas a esta comunidad

Buenas! Para Twitter España ser perfil falso está dentro de las normas, no se puede denunciar por este motivo. De los tres últimos casos en los que he demostrado su falsedad, solo @duplamaria ha sido suspendido y no sé si será por mi hilo por otros motivos. Mi objetivo es dar a conocer que eso existe y cómo lo hacen. Por lo menos la prensa, la radio y la TV ya hablan de ello. El astroturfing le proporciona a Twitter usuarios y tráfico eso es negocio para ellos, no lo van a combatir con mucho entusiasmo.
Con los partidos no tengo relación, algunos partidos políticos me siguen para ver lo que público pero nunca he recibido ningún comentario de ellos. Los ataques cuando he descubierto perfiles falsos vienen de troles que dicen lo mismo, independientemente de su ideología. Según ellos soy una esbirra de la Sexta DD.
No sabía de la importancia del debate de la tortilla en menéame . He visto en Twitter que el debate arranca desde el 2010


#17 ContinuumST

Hola, Mariluz, sabiendo que el mundo de las redes sociales está lleno de "postureo", medias verdades, cuidado de la imagen propia, hipocresía, etc. ¿Cómo se sabe que los datos son acertados a lo que la gente realmente piensa u opina? ¿Cómo -desde tu disciplina- se puede dirigir las opiniones de la gente? ¿Hay un límite, alguna línea roja donde el poder de la presión social mediática falle o fracase?
Gracias.

Hola! cuando se hacen análisis hay que tener en cuenta el ruido y como también se tiene historia de tiempos menos ruidosos se puede comparar. Las redes sociales amplían los canales de comunicación con poco coste. Esto hace que cada causa intente difundir su mensaje lo más posible con buenas o malas prácticas. Antes en Twitter predominaban opiniones progresistas pero desde una año a esta parte eso ha cambiado y podemos ver mensajes xenofónos, antifeministas u homófobos muy explícitos. Esto puede hacer que ciertas personas que no tuvieran una opinión muy formada en estos temas, las adopten. y otras que viendo que es una corriente de opinión en auge se dejen llevar. No sé si esto tendrá un límite


#21 MellamoMulo

Hola Mariluz,
Con las últimas bochornosas noticias sobre el Ministro de interior, la cúpula policial y medios de comunicación tejiendo una trama para derrocar un partido. ¿Cómo se puede explicar que un número tan ingente de personas piensen que dicho partido fue financiado por Venezuela?
Disculpa mi pregunta si no esta en tu campo de trabajo

Como muchas personas que creen el bulo que si te pica un mosquito te quedas embarazada. Te sorprendería la de personas que creen que no hemos ido a la luna y cosas similares. Si se ha repetido un bulo hasta la saciedad, al final lo dar por cierto. Además, la gente se cree lo que reafirma sus ideas.
Normalmente los desmentidos tienen menos recorrido que la propagación de la mentira


#9 thorin

Hola Mariluz. Viendo cómo proliferan los bots y los grupos organizados en las redes sociales para la creación de astroturfing, y cómo se perfeccionan ¿Tendrá algún sentido a medio plazo seguir investigando las redes sociales abiertas?

Teóricamente podrían crearse herramientas para limpiar ese ruido pero ¿Quien nos asegura que no se las van a saltar? No tienen pinta de ser tontos y seguro que tienen recursos.

Las redes abiertas es lo único que tenemos para investigar. Tienen mucho ruido y va en aumento pero hay que buscar mecanismos para identificarlo. Yo estoy en ello. Las plataformas no va a ayudar pero la gente va siendo consciente de ese ruido y lo va identificando. La comunicación es poder y siempre existirá la manipulación, pero no por eso hay que tirar la toalla y dejar de averiguar que pasa


#14 Schrödinger_katze

Congosto la saludo, Mariluz.
¿Qué influencia tienen las granjas de bots (y de troles) y cómo podemos identificar una operación de esta?

También, ¿cómo se puede contrarrestar la propaganda que difunden?

Al final, las voces humanas o bien intencionadas acaban ahogadas en un mar de mensajes extremistas y es complicado distinguir qué es real, porque en la vida real nunca nos hemos enfrentado con algo así a tal escala.
A mí me parece que las redes sociales serán el campo de batalla de esta parte del siglo XXI. Si ya la propaganda era efectiva antaño, ahora la recibes en el móvil constantemente.

Edito: parece que #9 se me ha adelantado.

lHola! Las granjas de bots y los perfiles falsos intentan convencernos de ciertas opciones políticas tienen muchos seguidores. Algo tan antiguo como la entrada de clac los teatros para aplaudir pero en este caso a escala industrial. Hay pistas para identificarlos: fecha reciente de creación del perfil (creado para la campaña). fecha antigua con pocos tuits (cuenta comprada). foto de perfil de un banco de imágenes, incoherencia entre foto, descripción o contenidos. Uso de herramientas de escritorio como tweetdeck, etc..Hay que ignóralos, no entrar en polémica con los trols y no darles visibilidad. Tenemos que tener actitudes más analógicas como leer los programas y reflexionar sobre nuestro voto. Las redes sociales no es buen lugar para dejarse llevar.


#10 FastFood4Ever

La tortilla sin cebolla no es tortilla, es un engendro de huevo y patata.

En la discusión de la tortilla saldría un grafo muy polarizado con dos grupos contrapuestos, como la política misma


#8 soberao

¿Cómo está el tema legal y ético en cuanto a usar datos de Internet y de las redes sociales, que los usuarios han publicado, pero para los que no tenemos permiso expreso directo (ni a favor, ni en contra) de estos usuarios para usarlos en estudios? Por ejemplo, la directiva europea de protección de datos personales. Una persona en un blog puede publicar datos personales sobre su caso, y cualquiera puede leer. Estos datos pueden ser muy importantes en un estudio por ejemplo, pero ¿cómo se deben utilizar o referenciar esos datos a la hora de usarlos para un estudio, teniendo en cuenta las leyes y la cuestiones éticas en cuanto a la privacidad de las personas referenciadas, aunque esa privacidad no existe o no se ha tenido en cuenta en los datos originales que aparecen publicados en Internet?

Cuando exponemos nuestros datos públicamente tenemos que ser conscientes de que pueden ser usados para todo tipo de fines. Lo que publicamos en blogs y en Twitter se puede analizar y relacionar e inferir características de nosotros. En los estudios que realizo se basan en datos públicos pero dando siempre la visión global sin entrar en el dato personal. Desde mi punto de vista los datos públicos son muy valiosos para investigación pero deberían estar protegidos de su uso comercial. Los datos públicos son una insignificancia con los que poseen las grandes tecnológicas como google, Facebook, Amazon, Netflix etc.. Ellas sí que pueden hace dinero porque les hemos dado permiso al aceptar las condiciones del servicio. No sé mucho de legislación pero en Europa la privacidad está más protegida. Aquí no se puede poner un negocio de venta de datos elaborados con información pública, pero últimamente hemos visto que los partidos políticos pueden rastrear datos personales y hacer perfiles ideológicos. Esto es muy preocupante porque parece una excepción para ellos


#29 Zarandea_me

Hola Mariluz, te voy a incomodar.
Un sabio que hacía tertulias en en una emisora A.M me dijo una vez algo que desgraciadamente he acabado compartiendo, decía que tras la dictadura España había cambiado profundamente y afirmaba con rotundidad que en la actualidad:
"España és un país de ignorantes y cobardes"...
Obviamente se refería a la masa social general en la cual se pueden encontrar honrosas excepciones. Pero personalmente no puedo mas que darle la razón para explicar como és posible que un pueblo no solo permita, si no que vote o se abstenga a semejante clase política plagada de corruptos e ignorantes que no han cotizado ni un año en su vida o se presten sin apenas queja al blanqueo de una dictadura. La pregunta es clara, tu que tocas datos directos de la calle, del pueblo y que los procesas y analizas... ¿Estás de acuerdo con esta afirmación?

Los datos no tienen opinión, solo miden. Lo que se mide por Twitter no tiene nada que ver con los resultados finales porque hay mucha sobreactuación de unos y silencio de otros. De los datos podemos sacar una foto de un periodo de bombardeo de mensajes y de cómo reaccionamos ante ellos.


#23 efectogamonal

Hola MariLuz,

tengo muchísima curiosidad en saber, qué ingredientes son absolutamente necesarios, para preparar un buen pucherazo a fuego lento, para que la ciudadanía se lo trague con gusto en unas elecciones generales.

Muchas gracias

El puchero lo cocinan con primor todas las formaciones políticas esperando que su olor atraiga a los votantes.


#3 kikocrespo

Por fin alguien con criterio para confirmar que la tortilla de patata es sin cebolla

Con una buena difusión, le podríamos dar la vuelta a la tortilla, desterrado la cebolla. Sería una gran pérdida


#2 zoezoe

Bienvenida !...¿Tiene campo de valoración en tu trabajo la introyección, es decir, el proceso cognitivo por el cual se hacen propios rasgos, conductas y fragmentos del mundo que nos rodea, especialmente de la personalidad de otros sujetos?

Yo estudio la propagación, lo que hace que los mensajes se expandan. El proceso es muy endogámico. En las redes estamos conectados en grupos pequeños, incluso en Twitter que es pública, cada uno está en su burbuja. Pero esas burbujas pueden crecer y empezar a influenciar a personas que estaban fuera de ellas. Cuando ideas o comportamientos empiezan a expandirse siempre van a encontrar a personas predispuestas a asimilarlo. Por eso se intenta visibilizar los mensajes, de forma natural o forzada


#37 cristomc

Hola Mariluz! un placer verte por estos lares.

He seguido mucho tus hilos explicando el movimiento de granja de bots/usuarios sincronizados y demás (por cierto, felicidades, da gusto ver que alguien se toma la molestia de desenmascarar ese tipo de prácticas). Pero me han surgido muchas dudas a raíz de tus descubriminetos.

- ¿Cómo se podría detectar los usuarios "no-bots" que están sincronizados en RRSS y portales que se encuentran preparados para atacar/desviar la atención de determinadas noticias? Es fácil ver como desde todos los partidos usan esta técnica para evitar que toda noticia que les afecte no provoque un gran impacto social. Es mas, este tipo de tácticas se llevan de manera sutil y se basa en desgastar al "adversario".

- ¿Podría un ML entrenado con datos como los que has almacenado ser capaz de marcar potenciales cuentas bots? Aqui interviene mucho la semantica, sobre todo con los pesos que tienen para determinada "tendencia manipuladora"

-¿Crees que hay interés real por detener la manipulación de tendencias? Está claro que los políticos tienen interés en que esta rueda funcione bien y sea sutil, pero dentro de entornos empresariales podría no ser tan interesante (aunque obviamente Twitter/Youtube/Facebook prioricen niveles de actividad sobre calidad de contenido....)

Contra la sincronización externa se puede aplicar un análisis temporal y de concurrencia de ciertos perfiles. Con unos cuantos TT de un partido se podrían detectar patrones de funcionamiento y los agentes que los mueven. Con ML lo veo complicado para alimentar el modelo por el uso de ciertos tópicos (varían mucho y son impredecibles) pero veo más factible tener identificados los posibles perfiles organizados y ver cuando su comportamiento se sale del patrón normal y entran en "campaña"

Las tendencias son campañas y por tanto se organizan con mejores o peores prácticas. En marketing interesan mucho porque dan una visibilidad más allá de la red de contactos.


#16 Forni

A tenor de eso, en la teoría de la comunicación encontrarás mucho, mucho, mucho, mucho sobre el asunto, aunque no creo que llegando a una "ciencia cierta". Primero porque cada caso de comunicación tiene su propio ecosistema de medios, agentes, opiniones, estado social... Y 2º porque la digitalización en 10 años ha acortado los tiempos una barbaridad. Hoy casi podemos hablar menos de analizar como predecir, o atisbar, porque las reacciones a los sucesos son inmediatas (Solemos hablar "retransmisión de los hechos", hoy para mí es prácticamente una simultaneidad).

En ese sentido, Twitter ha sido muy interesante (tuve que estudiarlo en época del surgir de Podemos donde las estrategias se basaban en controlar los tiempos para los TT, fundamentalmente), no te sabría decir hoy en día porque los usuarios se han dispersado.

Este índice creo que es ilustrativo, pese a antiguo la teoría cruda ha cambiado poco:
www.um.es/tic/Txtguia/Introduccion a las Teorias de la Informa (20)/TI

La dinámica en las redes va por delante de los estudios. Todos cambia demasiado rápido para poder tener una foto de los que pasa en el presente con fiabilidad


#31 hormiga_cartonera

Hola Mariluz, ¿podrías hablarnos un poco del aspecto técnico? ¿Cuáles son las herramientas y/o tecnologías que soléis utilizar?

Hola! me alegro que lo preguntes. Las herramientas que uso para bajar datos de Twitter y procesarlos están disponibles en github (github.com/congosto). Luego se puede usar Gephi para análisis de redes y alguna herramienta de visualización como tableau public para análisis de series temporales. No es demasiado complicado hacer estos análisis


#50 doxrealm

Hola Mariluz,
Qué libros / blogs / perfiles puede recomendar para el tema de Análisis de Redes Sociales. Con 5 sería muy feliz.
En mi pequeño país, se empezaron a usar granjas de bots para campañas de astroturfing desde 2015, y Twitter pasa de las denuncias. Qué recomiendaría para conseguir que la gente no sea engañada por este tipo de artimañanas.
Muchas gracias por el gran trabajo que realiza.

Pues no sé si te puedo dar 5 blogs porque no hay mucha gente estudiando esto.

Me vienen a la cabeza estos:

el blog de Marcelino Mariscal te puede ser muy útil www.mmadrigal.com/
Este blog es un clásico en España botsdetwitter.wordpress.com/
algoquedaquedecir.blogspot.com/2017/11/seo-y-bots-twitter-en-madrid.ht


#11 Ze7eN

Hola Mariluz.

En series como House of Cards se recurre a especialistas e investigadores de datos sociales como tú que trabajan con Big Data para lograr cambiar la percepción en masa de grupos de votantes o incluso de la opinión pública, especialmente en periodos electorales. ¿Cuán lejos estamos de ver algo similar en nuestro país?

Antes del big data los políticos se han guiado por las encuestas. Ahora tienen más posibilidades para averiguar que queremos oír. Nos va a llegar un mensaje adaptado más al corazón que a la razón y muy segmentado. Datos y tecnología existen para hacerlo. En el caso de Twitter la segmentación no está resuelta pero en Facebook se puede hacer llegar el mensaje muy segmentado. En nuestra mano está el creerlo o no


#42 Dadrio

¿Crees que una red neuronal podría ayudarte? ¿Sabes que es el aprendizaje profundo o el reforzado?

Serían unas tecnologías muy interesantes para aplicar, ¿Tu que piensas?

No he entrado en ese tipo de tecnologías porque para entrenar el modelo tienen que tener muchos datos y son muy cambiantes de una caso a otro. Por ahora la clasificación de perfiles usando análisis de red me da muy buen resultado. No descarto enredar con estas tecnología si tengo gatos suficientes y tiempo para entrenar


#13 DogSide

#3 Ya está bien del vacuo debate de la tortilla "sin cebolla-con cebolla". Ella nos puede confirmar lo que con toda seguridad reflejan los datos que maneja: Que la Nocilla es mucho mejor que la Nutella.

no se que tipo de grafo daría la combinación de la tortilla con/sin y la nocilla/nutella