Ai Pin de Humane de cerca


Unas pocas horas Después de la gran presentación de esta mañana, Humane abrió sus puertas a un puñado de periodistas. Ubicada en un edificio anodino en el vecindario SoMa de San Francisco, la oficina alberga a los equipos de diseño de hardware de la startup.

Una oficina al lado alberga a los ingenieros de productos de Humane, mientras que el equipo de ingeniería eléctrica opera desde un tercer espacio directamente al otro lado de la calle. La empresa también tiene una oficina en Nueva York, aunque la mayor parte de su plantilla de 250 personas se encuentra aquí en San Francisco.

Hoy en día, gran parte del espacio está ocupado por una serie de estaciones de demostración (con una estricta política de no filmar), donde diferentes Ai Pins están dispuestos en distintos estados de desnudez, exponiendo sus maquinaciones externas. Sin embargo, antes de asistir, los cofundadores de Humane se paran frente a un pequeño grupo de sillas, flanqueando una pantalla plana que expone la visión de la empresa.

La directora ejecutiva Bethany Bongiorno ofrece una breve historia de la empresa, comenzando por cómo conoció al cofundador y presidente Imran Chaudhri en su primer día en Apple. Toda la historia de la empresa se remonta a su antiguo empleador. Fue allí donde cazaron furtivamente al CTO Patrick Gates, junto con unos 90 ex Applers más.

Créditos de imagen: Brian calentador

Por su parte, Chaudhri enmarca la historia de la empresa como una de curvas en S: ciclos de tecnología de 15 años que forman la base y, en última instancia, dan paso a lo que viene. “La última era se ha estancado”, dice a la sala, afirmando que el teléfono inteligente tiene “16 años”, aunque esto también parece ser un guiño a sus antiguos empleadores, cuyo primer iPhone llegó en 2007.

Enmarca el primer producto de Humane como «una nueva forma de pensar, una nueva sensación de oportunidad». Es un esfuerzo, añade, por «productizar la IA». La presentación en persona es decididamente más fundamentada de lo que los videos anteriores te harían creer. Es cierto que las declaraciones siguen siendo grandiosas y amplias, y contextualizan el dispositivo que se lleva en la solapa como el siguiente paso en un viaje informático que comenzó con mainframes del tamaño de una habitación, pero la conversación se vuelve un poco más pragmática cuando el dispositivo se presenta ante nosotros.

El dispositivo del tamaño de una caja de cerillas cuenta con un procesador Snapdragon y 32 GB de almacenamiento local. La cámara es un sensor de 12 megapíxeles diseñado para un smartphone pero integrado en el propio módulo de Humane. Hay un acelerómetro y un giroscopio y un sensor de profundidad y tiempo de vuelo. Al igual que los productos de Apple, está diseñado en California y fabricado principalmente en Asia.

La mayor parte del exterior del dispositivo está monopolizada por un panel táctil que alberga la mayoría de los componentes integrados y una batería que debería durar cuatro o cinco horas con una carga. Encima de esto, una especie de barra de cámara alberga los sensores anteriores, junto con el sistema de proyección láser, de lejos el aspecto visualmente más llamativo de todo el asunto. La barra de la cámara está inclinada en ángulo hacia abajo. Humane dice que probaron el pin en una variedad de tipos de cuerpo diferentes y eligieron un diseño que se adapta a usuarios con cofres más grandes.

La compañía también me dijo que probó la proyección láser con un espectro de diferentes tonos de piel para asegurarse de que fuera visible. Si bien son visualmente llamativas, las proyecciones se consideran una característica secundaria de lo que es esencialmente un producto que prioriza la voz. Sin embargo, si estás en un entorno demasiado ruidoso o demasiado silencioso para acomodar el pequeño altavoz orientado hacia arriba que se encuentra en la parte superior del dispositivo, toca el panel táctil y la cámara se pondrá a trabajar buscando una mano. Una vez detectado, comienza a proyectarse.

Créditos de imagen: Brian calentador

Chaudhri demostró la función durante una charla TED en mayo. Uno o dos minutos después, llega una llamada preparada de Bongiorno, que el alfiler proyecta en su palma en forma de texto. Desde aquí, puede tocar la palma de su mano para aceptar o rechazar la llamada, y el sistema identifica el movimiento y actúa en consecuencia.

Sin embargo, los láseres pueden mostrar mucho más. Muestran texto de mensajes, por los que puedes desplazarte con un gesto de pellizco en la misma mano. Incluso pueden mostrar vistas previas rudimentarias de las imágenes que toma, aunque el láser verde no hace el mejor trabajo al resaltar las sutiles complejidades de una foto.

El AI Pin tiene un poco de peso, aunque esto se compensa un poco con el «refuerzo de batería» que se envía en la caja, lo que eleva la duración total de la batería a aproximadamente nueve horas. El producto también viene con un estuche en forma de huevo que agrega otra carga completa al producto. Puedes deslizar el Pin, el refuerzo o ambos y encajarán en su lugar magnéticamente. La carga se realiza mediante una serie de pines en la parte posterior del dispositivo. También en la caja hay una plataforma de carga para uso doméstico.

Bongiorno confirmó informes anteriores sobre un lote inicial de 100.000 unidades. «Creo que, como ocurre con cada puesta en marcha de hardware, queremos asegurarnos de planificar de forma conservadora todos los escenarios», afirma. «Para nosotros, al principio, realmente se trataba de ver qué era lo más conservador, correcto y responsable a hacer, en términos de demanda y permitirnos la opción si nuestra demanda supera los 100.000».

Añade que, hasta ayer, más de 110.000 personas se habían inscrito para esperar, aunque esa cifra es más una indicación de curiosidad que de planes de compra reales, ya que no se requirió ningún depósito. La lista también es global, mientras que el dispositivo sólo está disponible para pedidos por adelantado en los EE. UU., donde saldrá a la venta en algún momento “a principios del próximo año”. El grupo de la lista de espera inicial tendrá “acceso prioritario” para comprar el producto.

Créditos de imagen: Brian calentador

El corazón del dispositivo es la IA. Es uno de los primeros productos de hardware que aprovecha la actual ola de entusiasmo en torno a la IA generativa, pero ciertamente no será el último. El nombre de Sam Altman ha estado estrechamente vinculado a la startup desde el día en que se anunció. Pregunto qué tan estrechamente estuvieron involucrados Altman y OpenAI en la creación del producto.

«Sam lideró nuestra Serie A en 2020. Imran tenía muy claro que Sam era el objetivo de la Serie A y realmente quería que participara», dice Bongiorno. “Creo que había mucho respeto mutuo y entusiasmo por lo que todos creíamos que era el futuro, en términos de informática. Ha sido un increíble defensor y partidario de nosotros, y contesta el teléfono cada vez que necesitamos consejo y orientación. Hemos estado trabajando con el equipo de OpenAI. Nuestro equipo de ingeniería colaboró ​​y trabajó en estrecha colaboración”.

Según Chaudhri, GPT es uno de los muchos LLM que aprovecha el sistema. También confirmó que GPT-4 estará entre las instancias que utilizará el sistema. Sin embargo, en última instancia, el diseño de los sistemas de IA precisos que se utilizan para cualquier tarea determinada es algo turbio. Se accede a ellos caso por caso, según la determinación del pin sobre el curso de acción apropiado.

Esto también se aplica a las consultas basadas en web. El sistema rastrea una variedad de diferentes motores de búsqueda y recursos como Wikipedia. Algunos serán socios de contenido oficiales, otros no. Hasta ahora, los socios son limitados. Están OpenAI y Microsoft, así como Tidal, que sirve como aplicación de música predeterminada del sistema. Un ejemplo dado durante una de nuestras demostraciones fue «reproducir música producida por Prince», en lugar del más sencillo «reproducir Prince».

“Parte de nuestra IA es patentada. Construimos nuestras propias IA y luego aprovechamos cosas como GPT y modelos de OpenAI”, dice Bongiorno. “Podemos agregar LLM y muchos servicios de otras personas, y nuestro objetivo es ser la plataforma para todos y permitir el acceso a muchas experiencias y servicios de IA diferentes, por lo que el modelo de negocio está estructurado de una manera que nos permita Para hacer eso. Y creo que estaremos pensando en diferentes modelos de ingresos que también podemos agregar y diferentes flujos de ingresos en la plataforma”.

Créditos de imagen: Brian calentador

El objetivo es hacer que la experiencia sea perfecta, tanto en términos de lo que sucede en el back-end con los LLM como de las búsquedas y actualizaciones web. El sistema está diseñado para impulsar actualizaciones continuamente y agregar nuevas funciones en segundo plano. También utiliza contexto adicional, incluidas preguntas realizadas recientemente y ubicación, utilizando el GPS integrado.

Las fotos también son una gran pieza del rompecabezas. La cámara a bordo tiene un ángulo ultra gran angular con un campo de visión de 120 grados. No hay enfoque automático en juego, sino una distancia focal fija. Al menos a la luz de las oficinas de SF, las fotos parecían sólidas. Hay una buena cantidad de fotografía computacional que se realiza fuera de los dispositivos, incluido tener en cuenta si el pin está nivelado al tomar una foto y orientar la imagen final en consecuencia.

Todo todavía parece muy temprano aquí, pero está claro que se puso mucho cuidado (y dinero) en el producto. La demanda es quizás el mayor interrogante aquí. ¿Humane realmente ha encontrado una aplicación excelente? Para los fabricantes de relojes inteligentes, la salud ha sido durante mucho tiempo la respuesta. Pero el seguimiento de la salud juega aquí un papel significativamente menor.

En realidad, el producto no entra en contacto directo con la piel del usuario, por lo que las métricas de salud que es capaz de recopilar están limitadas más allá de servir como un podómetro, aunque esa característica tampoco es compatible actualmente. La característica más importante relacionada con la salud en este momento es el conteo de calorías, que específicamente le indica cuántas calorías y otros datos nutricionales hay en el trozo de comida que sostiene frente a la cámara, utilizando una plataforma de identificación de alimentos de terceros anónima.

Créditos de imagen: Brian calentador

El precio ciertamente será un obstáculo para el dispositivo no probado: $699 es básicamente nada para los estándares de los teléfonos inteligentes, pero es mucho pedir para un producto de primera generación y un nuevo factor de forma. Los $24 adicionales al mes tampoco ayudan, aunque Bongiorno agrega: “Obtendrás un número de teléfono; obtienes llamadas, mensajes de texto y datos ilimitados; Recibirá tantas consultas de IA como desee, además de todos nuestros servicios de IA. Hoy vemos cuánto entusiasmo hay en torno a ChatGPT, donde la gente ya está pagando por acceder a él”.

Sin embargo, si no paga ese mes, el producto es efectivamente un pisapapeles hasta que comience la suscripción.

Antes de que termine nuestra sesión, le pregunto a Chaudhri cómo llegó la empresa a la solapa, de todos los lugares, especialmente cuando las pantallas en la cabeza se han visto como la opción predeterminada durante algún tiempo. Seguramente su antiguo empleador, Apple, está apostando de frente con su próximo Vision Pro.

«Siempre se ha asumido que la computación contextual es algo que hay que llevar en la cara», afirma. “Hay muchos problemas con eso. Muchas personas usan gafas que se ponen por un motivo realmente preciso. Es para ayudarle a ver o para proteger sus ojos. Esa es una decisión muy personal: la forma de tu estructura, el peso de tu estructura. Todo se resume en algo que es tan único como tú. Si nos fijamos en el poder del contexto, y ese es el impedimento para lograr la computación contextual, tiene que haber otra manera. Entonces empezamos a mirar ¿cuál es la pieza que nos permite ser mucho más personales? Se nos ocurrió el hecho de que todos usamos ropa, entonces, ¿cómo podemos adornar un dispositivo que nos brinde contexto en nuestra ropa?



Source link-48