Lo que necesitas saber
- Estudiantes de posgrado de la Universidad de Stanford han desarrollado una aplicación impulsada por inteligencia artificial que puede determinar su ubicación exacta basándose en Google Street View.
- La herramienta promete una precisión del 92%, reduciendo la ubicación a 25 kilómetros de la ubicación exacta en más del 40% de sus conjeturas.
- Mientras realizaba pruebas comparativas, la aplicación venció al renombrado jugador de GeoGuessr Trevor Rainbolt en seis partidos.
- La aplicación se basa en la red neuronal CLIP de OpenAI, que le permite vincular texto con imágenes.
- El modelo no se ha enviado con amplia disponibilidad debido a preocupaciones de seguridad y privacidad.
IA generativa fue enorme en 2023 y se espera que mantenga el mismo ritmo en 2024. Es cierto que los usuarios han incursionado bastante con la tecnología y, en última instancia, lograron hazañas increíbles en medicamento, educación, política y tecnología en general. Microsoft ha estado a la vanguardia en la incorporación de IA en la mayoría de sus productos y servicios, especialmente después hacer una inversión multimillonaria en la tecnología de OpenAI.
En igual medida, la tecnología también ha sufrido reveses en torno a la seguridad y la privacidad. Esto ha llevado a los usuarios al límite, expresando descaradamente sus reservas hacia la IA. La administración de Biden tomó nota de este problema, lo que en consecuencia condujo a la emisión de una orden ejecutiva diseñado para colocar barandillas que ayudarán a regular el uso de la tecnología.
A medida que comenzamos el año, la IA sigue representando una amenaza (especialmente para los usuarios que prefieren llevar una vida silenciosa y privada). Las redes sociales abren tu vida al mundo entero. Afortunadamente, existen algunas medidas elaboradas que puede aprovechar para establecer un poco de privacidad, incluido hacer que sus cuentas de redes sociales sean privadas, limitar las capacidades de comentarios y visualización de estado e incluso elegir no incluir la ubicación precisa al compartir fotos.
¿Pero sabías que la IA puede determinar tu ubicación exacta a pesar de contar con las medidas mencionadas anteriormente? El año pasado, un grupo de estudiantes de posgrado de la Universidad de Stanford desarrolló una aplicación impulsada por IA con la capacidad de identificar y determinar su ubicación exacta basándose en una foto. La aplicación puede limitar su ubicación según la vista de la calle presentada en la foto o, en general, la fuente de la imagen compartida.
Según el proyecto denominado Predicción de geolocalizaciones de imágenes (PIGEON), la aplicación puede determinar la ubicación exacta donde se tomó una foto mirando Google Street View de la ubicación. Es más, la aplicación promete un 92% de precisión al determinar dónde se tomó la foto. La aplicación también puede reducir la ubicación a 25 kilómetros de la ubicación exacta en más del 40% de sus conjeturas.
Poniendo esto en perspectiva, PIGEON se ubicó dentro del 0,01% superior de los jugadores de GeoGuessr. Para aquellos que no lo saben, GeoGuessing es un juego de geografía en el que se espera que adivines la ubicación exacta donde se tomó una foto basándose en Google Street View de la ubicación. Para tener un poco de contexto, esta fue toda la premisa de PIGEON.
¿Cómo funciona PALOMA?
La aplicación funciona con la red neuronal CLIP de OpenAI, que incluye la capacidad de vincular texto e imágenes. El modelo se entrena con los nombres de las categorías visuales en las que centrarse. Venció al mundialmente famoso jugador de GeoGuessr Trevor Rainbolt en una serie de seis partidos.
Al inicio del proyecto PIGEON, los graduados de la Universidad de Stanford entrenaron la aplicación utilizando 100.000 ubicaciones originales de GeoGuessr, que fueron muestreadas al azar. Los graduados también descargaron cuatro imágenes para abarcar un «panorama» completo en un lugar determinado, lo que se tradujo en 400.000 imágenes.
Según uno de los graduados del proyecto PIGEON:
«Creamos nuestro propio conjunto de datos de alrededor de 500.000 imágenes de Street View. En realidad, no son tantos datos, [and] Pudimos conseguir un rendimiento bastante espectacular».
PIGEON puede captar detalles importantes como el follaje y el clima al identificar una ubicación específica. Esta es la razón principal por la que muestra un rendimiento increíble en comparación con otros modelos como DALL-E 2 de OpenAI. En comparación, este último se entrena utilizando millones de imágenes, sin olvidar los vastos recursos disponibles para hacerlo aún mejor, pero aun así PIGEON publica mejores resultados.
Gran violación de la privacidad inminente
Si bien esta es una hazaña increíble que potencialmente puede conducir a un gran desarrollo, no puedo evitar pensar en las implicaciones negativas que planteará la aplicación impulsada por IA si se envía a disponibilidad general.
LEER MÁS: New York Times demanda a Microsoft y OpenAI por cuestiones de derechos de autor
Los graduados de Stanford destacaron que la aplicación puede presentarse como una herramienta eficaz en lo que respecta a conducción autónoma, investigaciones visuales, seguridad y más. Sin embargo, si la tecnología cae en las manos equivocadas y se utiliza para fines nocivos distintos a los previstos, el daño que puede causar es muy preocupante.
Por ese motivo, el modelo no ha sido hecho público. Como se compartió en el proyecto, los estudiantes solo compartieron el código con fines académicos.
Como resultado, los estudiantes decidieron no publicar los pesos del modelo y solo publicaron el código para validación académica, según el documento.
¿Qué piensa sobre esta tecnología emergente y sus impactos a largo plazo en la privacidad y la seguridad? Háganos saber en los comentarios.