Apariencia en el juego: las aplicaciones de chat de video promueven funciones de inteligencia artificial ‘integrales’

Los servicios de videoconferencia siempre se han jactado de que su tecnología es “intuitiva” de usar o “integrada” para trabajar con otras herramientas, pero ahora proveedores como Google y Cisco no pueden publicar una publicación de blog sin declarar un tema diferente: “integral”.

La palabra de moda final, y el desarrollo de productos que la acompaña, muestra cómo recientemente las empresas de tecnología se han enfocado en asegurar a los usuarios negros y otras personas de color que los productos de chat en línea no los dejarán al descubierto. Los cambios se derivan en parte del auge del movimiento Black Lives Matter, que ha llevado a vendedores y clientes por igual a pensar más allá de las necesidades de la audiencia blanca de habla inglesa, y a la pandemia, que ha creado una gran fuerza laboral “remota” que depende fuertemente en tecnología.

Corporación Alfabeto (GOOGL.O) Este mes, Google planea implementar una función de inteligencia artificial (IA) que aborda el problema crónico de no iluminar los tonos de piel oscuros en los chats de video.

Cisco Systems, Inc. (CSCO.O) En enero, lanzó una función de reconocimiento de gestos para mostrar un pulgar hacia arriba en Webex, con un esfuerzo por garantizar que los tonos de piel no afecten el rendimiento. GoToMeeting LogMeIn Inc, Microsoft Corporation (MSFT.O) Teams y Facebook Inc (FB.O) El lugar de trabajo está agregando opciones de traducción o pronunciación en lo que describen como un pago de acciones.

“La tecnología actual no es fundamentalmente tan completa como le gustaría que fuera”, dijo Jitu Patel, vicepresidente senior y gerente general de Seguridad y Cooperación de Cisco. Dijo que establecer “los valores y principios que debe representar el producto” se ha vuelto fundamental.

READ  OnePlus Nord 2 5G Smartphone, OnePlus Buds Pro se lanzará mañana en India; Precios, características y especificaciones esperados

La industria de la tecnología ha sido criticada durante mucho tiempo por un historial pobre de diversidad en el lugar de trabajo y por no reconocer las formas en que el diseño de productos puede perpetuar la discriminación.

La preocupación por los prejuicios en las videoconferencias se extendió en septiembre pasado después de que Colin Madland, estudiante de doctorado de la Universidad de Victoria en Columbia Británica, Canadá, Captura de pantalla del tweet Un tipo negro parece sin cabeza cuando publica un fondo virtual en Zoom.

Los estudios de otros sistemas de implantes de IA han demostrado que generan más errores con piel más oscura, en parte porque los datos utilizados para entrenarlos incluían en su mayoría ejemplos más claros.

“El sesgo no estaba jugando un papel, sino más bien una combinación de la distancia del usuario a la cámara, el uso de auriculares y la posición sentada”, dijo a Reuters el director de diversidad de Zoom, Damien Huber-Campbell.

Madland dijo que el problema disminuyó después de que un colega compró una pantalla verde y una “iluminación atractiva”.

para acercar (De MO) y sus competidores, lograr la inclusión podría proporcionar una ventaja al competir por acuerdos pospandémicos con los clientes, quienes enfrentan sus propias cuentas de diversidad.

Se espera que el gasto global en conferencias basadas en la nube alcance los $ 5,41 mil millones este año, frente a los $ 5,02 mil millones en 2020, según la consultora de tecnología Gartner. No rastrea la participación de mercado, pero los analistas citan a Zoom y Cisco como líderes.

No están representados por igual

Niclas Blume, colíder de productos de Google involucrado en Meet, dijo que la próxima función de Google Meet aborda el problema de las personas que parecen más oscuras debido a su entorno, por ejemplo, cuando se sientan frente a una ventana.

READ  Sony Xperia 10 III Lite se revela silenciosamente en Japón: la mitad del almacenamiento perdido, eSIM ganado

“Los usuarios con piel más oscura no están igualmente representados y queremos diseñar productos para todos”, dijo.

La IA separa a los usuarios y sus fondos, determina si están subexpuestos independientemente de su tono de piel, ilumina la imagen en consecuencia y finalmente combina el fondo y el primer plano.

Stefan Hollod, jefe de producto de Meet para calidad y procesamiento de video, dijo que la sala de espera virtual de Meet pedirá a los usuarios que activen el ajuste de iluminación cuando detecten que pueden beneficiarse de él.

Bloom y Hollow dijeron que Meet identificó por primera vez los problemas de representación de video cuando lanzó la optimización con poca luz para llamadas de teléfonos móviles mucho antes de la pandemia. Llevó mucho tiempo desarrollar la última función, pero motivó a Meet a crear y delegar procedimientos de prueba de inserción de productos para todo su trabajo.

Google también está buscando soluciones adicionales. Meet alienta a los fabricantes de computadoras portátiles y sistemas operativos a compartir un mayor control sobre el balance de blancos y la exposición a las cámaras. Internamente, Google ha adoptado requisitos mínimos de reflexión de la luz para los diseños de salas de conferencias.

En Cisco, la nueva opción de reconocimiento de gestos, cuando está activada, permite a los usuarios levantar el pulgar de la cámara durante aproximadamente un segundo para crear un pulgar virtual en la pantalla.

Keith Griffin, el ingeniero principal de la compañía, dijo que Cisco ha entrenado a su inteligencia artificial para enfocarse en la forma de los contornos y el movimiento de los gestos en el tiempo y el espacio, reduciendo los problemas potenciales de un tono de piel desigual.

READ  El tan esperado enfriador de CPU pasivo NH-P1 de Noctua está aquí

Las manos que rezan, para un “gracias”, se encuentran entre las próximas posibles nuevas opciones de gestos, con una función que interpreta el lenguaje de señas como un objetivo final. Webex también espera agregar opciones de tono de piel distintas del amarillo para los íconos.

Mike Sharp, director de productos de LogMeIn para Comunicaciones Unificadas y Colaboración, dijo que los clientes de educación impulsaron algunas de las actualizaciones “integradas” de la empresa.

Por ejemplo, el próximo soporte para español, mandarín y otros idiomas en mensajes de correo de voz y grabaciones de audio beneficiaría a un distrito escolar desconocido en California que quería interactuar mejor con su comunidad, dijo Sharp.

Facebook Workplace, un conjunto de herramientas de comunicación empresarial, dijo el mes pasado que los anfitriones de videos pronto verán pronunciados los nombres de los empleados que hagan preguntas por escrito.

El director de productos, Ojwal Singh, dijo que los indicadores, que son generados por inteligencia artificial pero son editables, están destinados a ayudar a los ejecutivos de los clientes, incluida Nestlé SA. (NESN.S) y Booking Holdings Inc (BKNG.O) Dirígete a tus compañeros de forma adecuada y promueve la inclusión

“No quiero malinterpretarlo ante miles de empleados y parecer que no estoy en contacto con la empresa”, dijo.

Nuestro criterio: Principios de confianza de Thomson Reuters.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *