PrivacyTools.io

Como contrarrestar la linguistica forense

Como contrarrestar la linguistica forense

La estilometria es nuestro estilo de escritura personal y unico. Seas quien seas, tienes un estilo de escritura unico, identificable y rastreable. Esto se entiende desde hace tiempo, y una rama de la ciencia forense se basa en este principio: la linguistica forense. En este campo, el nombre concreto de la linguistica forense aplicada al crimen en internet es “Writeprint”. Writeprint busca principalmente determinar la identificacion del autor a traves de internet comparando el texto de un sospechoso con una coleccion conocida de textos invariantes de un escritor (normalmente escritos), e incluso sin textos de comparacion, esta tecnica forense puede revelar informacion personal sobre un autor, como el genero, la edad y la personalidad.

¿Que busca un adversario cuando examina tu escritura?

  1. Rasgos lexicos: analisis de la eleccion de palabras.
  2. Rasgos sintacticos: analisis del estilo de escritura, la estructura de las frases, la puntuacion y el uso del guion.
  3. Rasgos estructurales: analisis de la estructura y la organizacion de la escritura.
  4. Palabras especificas del contenido: analisis de escritura contextualmente significativa, como los acronimos.
  5. Rasgos idiosincraticos: analisis de los errores gramaticales; este es el factor mas importante a tener en cuenta porque ofrece una precision relativamente alta en la identificacion del autor.

Ejemplos:

¿Crees que esto no es algo a lo que un adversario preste atencion? ¡Piensalo otra vez! Ha habido varios casos en los que adversarios como las fuerzas del orden han usado tecnicas de Writeprint para ayudar a atrapar y condenar a personas. Aqui tienes algunos ejemplos:

  • El caso OxyMonster (https://arstechnica.com/tech-policy/2018/06/dark-web-vendor-oxymonster-turns-out-to-be-a-frenchman-with-luscious-beard/ Archive.org): Los datos publicos revelaron que Vallerius (alias OxyMonster) tiene cuentas de Instagram y Twitter. Los agentes compararon el estilo de escritura de “OxyMonster” en el foro de Dream Market, en su papel de moderador principal, con el estilo de escritura de Vallerius en sus cuentas publicas de Instagram y Twitter. Los agentes descubrieron muchas similitudes en el uso de palabras y de la puntuacion, incluida la palabra “cheers;”; dobles signos de exclamacion; el uso frecuente de comillas; y publicaciones ocasionales en frances.

No uses el mismo estilo de escritura para tus actividades sensibles que para tus actividades normales. En particular, presta mucha atencion a tu uso de frases hechas comunes y de la puntuacion. Ademas, como nota al margen: limita la cantidad de material de referencia que un adversario puede usar como texto de comparacion; no querras meterte en problemas por tu publicacion politica en Twitter o por aquella publicacion de Reddit que hiciste hace anos, ¿verdad?

  • Aqui tienes otro ejemplo del libro American Kingpin, sobre como un agente de la DEA investigo el estilo de escritura de DPR (Dread Pirate Roberts, alias Ross Ulbricht, fundador del mercado oscuro Silk Road) desde una perspectiva peculiar: por un lado, Ross Ulbricht usaba mucho la palabra “epic”, lo que mostraba que probablemente era joven. Tambien usaba caras sonrientes con emojis en su escritura, aunque nunca usaba un guion como nariz, escribiendolas como ”:)” en lugar del anticuado ”:-)”. Sin embargo, el rasgo de Ulbricht que mas destacaba era que, en lugar de escribir “yes” o “yeah” en los foros del sitio, Ulbricht siempre tecleaba “yea”.

Presta atencion a los pequenos detalles que podrian sumar. Si sueles responder a la gente con “ok”, quiza intenta responder con “okay” en tus actividades sensibles. NUNCA deberias usar palabras o frases de tus actividades sensibles (aunque no esten en una publicacion publica) para fines normales, y viceversa. Ross Ulbricht uso “frosty” como nombre para sus servidores de Silk Road y para su cuenta de YouTube, lo que ayudo a convencer a las fuerzas del orden de que Dread Pirate Roberts era, de hecho, Ross Ulbricht.

Como contrarrestar los esfuerzos de tu adversario:

  1. Reduce la cantidad de texto de comparacion con el que los adversarios puedan compararte. Esto va de la mano de tener una huella online reducida en tus actividades normales.
  2. Usa un procesador de texto (como LibreWriter) para corregir cualquier error gramatical o de ortografia que cometas con regularidad.
  3. Reduce o cambia las expresiones que usas mientras realizas actividades sensibles.
  4. Comprende como tu identidad afecta a tu estilo de escritura: ¿tu alias es mas joven? ¿Mayor? ¿Mas culto? ¿O menos culto? Si tu identidad es mayor, quiza habla con un estilo de escritura mas al estilo de JRR Tolkien.
  5. Presta atencion a como tu jerga y tu ortografia podrian identificarte. Si eres del Reino Unido, deberias decir “maths”, pero si eres de Estados Unidos dices “math”. No importa como digas “maths”, lo unico que importa es que puede usarse para perfilarte. Esto tambien aplica a la jerga, ya que muchas regiones tienen cada una una jerga distinta y sumamente concreta. No le pides a alguien de Estados Unidos un “rubber” y esperas que te den un “eraser”, por poner un ejemplo.
  6. Presta atencion a tu uso de emoticonos y emojis. En el ejemplo anterior, el agente de la DEA pudo hacer la suposicion correcta de que Ulbricht probablemente era joven porque no usaba un guion al hacer un emoticono sonriente.
  7. Presta atencion a como estructuras tu escritura. ¿Usas dos espacios despues de un punto? ¿Usas constantemente parentesis en tu escritura? ¿Usas la coma de Oxford?
  8. Piensa en que simbolos usas en tu escritura. ¿Usas €, £ o $? ¿Usas “dd-mm-yyyy” o “mm-dd-yyyy” para las fechas? ¿Usas “08:00 pm” o “20:00” para la hora?

Que podrian revelar sobre ti distintas elecciones linguisticas:

Emoticonos:

  1. Los rusos, por ejemplo, usan ”)” en lugar de ”:-)” o ”:)” para expresar una cara sonriente.
  2. Los escandinavos usan ”=)” en lugar de ”:-)” o ”:)” para una cara sonriente.
  3. La gente mas joven no suele usar un guion en sus caras sonrientes y simplemente usa ”:)”.

Rasgos estructurales:

  1. Dos espacios despues de un punto dan la impresion de que eres bastante mayor, porque asi se ensenaba a escribir a maquina a quienes aprendian a teclear con maquinas de escribir.
  2. En Estados Unidos la gente escribe los numeros con comas entre las cifras a la izquierda del numero inicial y con puntos entre las cifras a la derecha del numero inicial. Esto contrasta con la forma en que la gente escribe los numeros en el resto del planeta.

Estados Unidos: 1,000.00$

Europa: 1.000,00€

Ortografia, jerga y simbolos:

  1. Obviamente, la gente de distintas naciones usa distinta jerga. Esto es aun mas marcado cuando usas jerga que no es tan conocida en otros lugares, como cuando alguien del Reino Unido menciona un “headmaster” mientras que en otras naciones se le llama “principal”.
  2. La ortografia es otro factor importante, parecido a la jerga, salvo que es mas dificil de controlar. Si quieres fingir que eres de Estados Unidos, pero en realidad vives en Australia, basta con escribir una sola vez “colour” como color para que la gente entienda que algo pasa.
  3. Algunas personas tambien escriben ciertas palabras de una manera concreta que no es regional; por ejemplo, podrias escribir “ax” como “axe” o viceversa.
  4. Por supuesto, los simbolos que usas en tu teclado pueden revelar mucha informacion, como las £ o los $.

Tecnicas para evitar el writeprinting:

Aqui tienes algunas tecnicas en orden de uso:

  • Correccion ortografica y gramatical: Esto ayuda a evitar parte del fingerprinting que se hace a partir de tus errores de ortografia y gramatica.
  • Sin conexion con un procesador de texto: Usa un procesador de texto como LibreWriter y utiliza las funciones de correccion ortografica y gramatical para arreglar errores que puedas haber tecleado.
  • En linea con un servicio online: Si no tienes un procesador de texto disponible o no quieres usar uno, tambien puedes usar un corrector ortografico y gramatical en linea como Grammarly (esto requiere un correo electronico y crear una cuenta).

Tecnica de traduccion:

Despues de terminar con las correcciones ortograficas y gramaticales. Usa una web o software como Google Translate (o, para una version mas respetuosa con la privacidad, https://translate.metalune.xyz) para traducir entre varios idiomas distintos antes de volver a traducir a tu idioma original. Estas traducciones de ida y vuelta alteraran tus mensajes y haran que el fingerprinting sea mas dificil.

Aviso: un estudio archivado aqui: https://web.archive.org/web/20181125133942/https://www.cs.drexel.edu/~sa499/papers/adversarial_stylometry.pdf parece indicar que la tecnica de traduccion es ineficaz para evitar la estilometria. Este paso podria ser inutil.

Buscar y reemplazar:

Por ultimo, y de forma opcional, anade algo de ruido introduciendo a proposito algunos errores en tus mensajes.

Primero decide una lista de palabras que rara vez escribes mal, quiza las palabras “grammatical”, “symbol” y “pronounced” (esta lista deberia incluir mas palabras). No uses una opcion de reemplazo automatico de autocorreccion para esto, ya que podria corregir cuando no tiene sentido. En su lugar, usa Buscar y Reemplazar y hazlo manualmente para cada palabra. Tampoco uses “Reemplazar todo” y revisa cada cambio. Este es solo el primer paso para aportar informacion enganosa contra el fingerprinting linguistico.

A continuacion, encuentra una lista de palabras que uses habitualmente al escribir. Digamos que me encanta usar contracciones cuando escribo, quiza siempre uso palabras como: “can’t”, “don’t”, “shouldn’t”, “won’t” o “let’s”. Pues bien, quiza entra en LibreWriter y usa “Buscar y Reemplazar” para sustituir todas las contracciones por las versiones completas de las palabras (“can’t” > “cannot”, “don’t” > “do not”, “shouldn’t” > “should not”, “won’t” > “will not”, “let’s” > “let us”). Esto puede marcar una gran diferencia en tu escritura y crear una diferencia en como te perciben las personas y, lo mas importante, tus adversarios. Puedes cambiar la mayoria de las palabras por otras distintas; por ejemplo, puedes cambiar “huge” por “large”. Solo asegurate de que estas palabras encajen con tu identidad.

Ahora, plantea cambiar tu eleccion de palabras para que encaje con una ubicacion geografica. Quiza vivas en Estados Unidos y quieras dar la impresion de que tu identidad es del Reino Unido. Por ejemplo, puedes hacer uso de la ortografia y el lexico basados en la ubicacion. Esto es arriesgado, y un solo error puede delatarlo.

Lo primero de todo, tienes que decidir donde quieres dar la impresion de que estas. Aqui tienes un ejemplo para dar la impresion de que eres de Estados Unidos o del Reino Unido. Primero, tendras que entender un par de cosas sobre el lugar del que “es” tu identidad; no finjas que eres del Reino Unido pero no tengas ni idea de el, mas alla de que existe.

Despues de haber decidido un buen lugar del que sea tu identidad, investiga las diferencias de idioma entre las dos lenguas (en este caso, entre el ingles britanico y el ingles estadounidense). Gracias a internet, esto es bastante facil, y puedes encontrar paginas de Wikipedia que destacan comodamente las diferencias regionales de un idioma entre dos naciones. Presta atencion a como se escriben ciertas palabras (“metre” > “meter”) y que palabras se intercambian entre si (“boot” > “trunk”). Ahora que tienes una lista de palabras que pueden intercambiarse entre si, y una lista de ortografias que son diferentes, usa “Buscar y Reemplazar” en tu editor y cambia palabras como “colour” por “color”, y “lorry” por “truck”. De nuevo, no uses una funcion de autocorreccion ni “Reemplazar todo”, ya que algunos cambios podrian no tener sentido. Revisa cada cambio propuesto. Por ejemplo, si usaras autocorreccion o “Reemplazar todo” en la palabra “boot” para cambiarla por “trunk”, esto tendria todo el sentido en el contexto de los coches. Pero no tendria ningun sentido en el contexto de los zapatos.

Consejo final:

Comprende que tienes que pensar constantemente en que tecleas y como tecleas mientras realizas actividades sensibles.

Comprende que alterar tu estilo de escritura para tales fines puede, en ultima instancia, cambiar tu estilo de escritura de base, lo que ironicamente hace que tu escritura sea rastreable durante periodos mas largos.

Reléete al menos una vez despues de terminar de escribir cualquier cosa para verificar que no cometiste errores en el proceso. Confia (en ti mismo), pero verifica de todos modos.

Enlaces adicionales:

Fuente: The Hitchhiker’s Guide to Online Anonymity, escrito por AnonyPla © CC BY-NC 4.0