Cómo evitar que sus datos se utilicen para entrenar IA


En sus páginas de ayuda, OpenAI dice que los usuarios web de ChatGPT sin cuentas deben navegar a Ajustes y luego desmarque Mejorar el modelo para todos. Si tiene una cuenta y ha iniciado sesión a través de un navegador web, seleccione ChatGPT, Configuración, Controles de datos, y luego apagar Historial de chat y capacitación. Si estás utilizando las aplicaciones móviles de ChatGPT, ve a Ajusteselegir controles de datos, y apagar Historial de chat y capacitación. Cambiar esta configuración, dicen las páginas de soporte de OpenAI, no se sincronizará entre diferentes navegadores o dispositivos, por lo que debe realizar el cambio en todos los lugares donde use ChatGPT.

OpenAI es mucho más que ChatGPT. Para su generador de imágenes Dall-E 3, la startup tiene un formulario que permite enviar imágenes para ser eliminado de los “futuros conjuntos de datos de entrenamiento”. Le solicita su nombre, correo electrónico, si posee los derechos de imagen o si se está poniendo en contacto en nombre de una empresa, detalles de la imagen y cualquier carga de la(s) imagen(es). OpenAI también dice que si tiene un «gran volumen» de imágenes alojadas en línea que desea eliminar de los datos de entrenamiento, entonces puede ser «más eficiente» agregar GPTBot al archivo robots.txt del sitio web donde están alojadas las imágenes.

Tradicionalmente, el archivo robots.txt de un sitio web (un archivo de texto simple que generalmente se encuentra en nombre del sitio web.com/robots.txt) se ha utilizado para indicar a los motores de búsqueda, y a otros, si pueden incluir sus páginas en sus resultados. Ahora también se puede utilizar para decirle a los rastreadores de IA que no eliminen lo que usted ha publicado, y las empresas de IA han dicho que respetarán este acuerdo.

Perplejidad

Perplexity es una startup que utiliza IA para ayudarte a buscar en la web y encontrar respuestas a tus preguntas. Al igual que el resto del software de esta lista, usted elige automáticamente que sus interacciones y datos se utilicen para entrenar aún más la IA de Perplexity. Desactívelo haciendo clic en su nombre de la cuentadesplazándose hacia abajo hasta Cuenta sección y apagando el Retención de datos de IA palanca.

Quora

Quora a través de Matt Burgess

Quora dice que «actualmente» no utiliza respuestas a las preguntas, publicaciones o comentarios de las personas para entrenar la IA. Tampoco ha vendido ningún dato de usuario para el entrenamiento de IA, afirma un portavoz. Sin embargo, ofrece opciones de exclusión voluntaria en caso de que esto cambie en el futuro. Para ello, visite su Ajustes página, haga clic para Privacidad, y apaga el “Permita que se entrenen modelos de lenguaje grandes en su contenido» opción. A pesar de esta elección, hay algunas publicaciones de Quora que pueden usarse para capacitar a los LLM. Si responde a una respuesta generada por una máquina, dicen las páginas de ayuda de la compañía, entonces esas respuestas pueden usarse para el entrenamiento de IA. Señala que los terceros pueden simplemente eliminar su contenido de todos modos.

Rdo

Rev, un servicio de transcripción de voz que utiliza trabajadores autónomos humanos e inteligencia artificial para transcribir audio, dice que utiliza datos «perpetuamente» y «anónimamente» para entrenar sus sistemas de inteligencia artificial. Incluso si eliminas tu cuenta, seguirá entrenando su IA con esa información.

Kendell Kelton, jefe de marca y comunicaciones corporativas de Rev, dice que tiene el «conjunto de datos de voces más grande y diverso», compuesto por más de 6,5 millones de horas de grabación de voz. Kelton dice que Rev no vende datos de usuarios a terceros. Los términos de servicio de la empresa dicen que los datos se utilizarán para capacitación y que los clientes pueden optar por no participar. Las personas pueden optar por que sus datos no sean utilizados por enviando un correo electrónico a [email protected], dicen sus páginas de ayuda.

Flojo

La empresa también podría utilizar todos esos mensajes aleatorios de Slack en funcionamiento para entrenar sus modelos. “Slack lleva muchos años utilizando el aprendizaje automático en su producto. Esto incluye modelos de aprendizaje automático a nivel de plataforma para cosas como recomendaciones de canales y emojis”, afirma Jackie Rocca, vicepresidenta de producto de Slack que se centra en la IA.

Aunque la empresa no utiliza datos de clientes para entrenar un modelo de lenguaje grande para su producto Slack AI, Slack puede usar sus interacciones para mejorar las capacidades de aprendizaje automático del software. «Para desarrollar modelos de IA/ML, nuestros sistemas analizan los datos del cliente (por ejemplo, mensajes, contenido y archivos) enviados a Slack», dice la página de privacidad de Slack. Al igual que en Adobe, no hay mucho que pueda hacer a nivel individual para optar por no participar si está utilizando una cuenta empresarial.



Source link-46