Amazon ha facilitado la adición de sonidos a las habilidades personalizadas de Alexa

Soy reconocido como Campeón de Amazon Alexa y he publicado más de veinte habilidades personalizadas en la plataforma. Sigo buscando nuevas formas de estirar esta tecnología, y una de las mejores formas que he encontrado para mejorar la experiencia del usuario es agregando sonidos. Dada la reciente mejora de la plataforma Amazon Alexa, esto se ha vuelto aún más fácil. Aquí hay una breve revisión sobre cómo puede aprovechar esta nueva función.

Cómo funciona Amazon Alexa

La plataforma Alexa tiene la capacidad de habilitar habilidades personalizadas creadas por desarrolladores externos. Ahora hay más de 30k de ellos disponibles, y los millones de usuarios de Alexa pueden habilitarlos en sus dispositivos. Estos van desde pedir una pizza de una cadena popular hasta reproducir sonidos para ayudar a dormir.

La arquitectura de estas habilidades personalizadas tiene dos componentes. El primero es el componente de voz que aprovecha los modelos de aprendizaje automático de la plataforma Alexa. Esto es lo que traduce las solicitudes de palabra hablada en un conjunto de instrucciones.

El otro componente es la lógica if / then / else que decide qué respuesta debe regresar al usuario. Está alojado en una función de AWS Lambda.

Para mejorar las habilidades, se pueden utilizar servicios de AWS adicionales, así como herramientas de terceros. Esto incluye la grabación de gráficos y sonidos MP3 personalizados que se pueden aprovechar con la función Lambda.

Para agregar sonidos, los archivos MP3 se cargan en un depósito de S3 y se aplica la política de acceso adecuada para que un dispositivo Alexa pueda leerlos.

Desafíos al agregar sonidos personalizados

Una de las barreras de entrada para incluir sonidos en habilidades personalizadas ha sido la capacidad de grabar sonidos de alta calidad. Estos sonidos deben coincidir con los estándares exactos de la plataforma, incluida la frecuencia de bits y la frecuencia de muestreo. Esto se puede hacer a través de la experiencia en edición de sonido utilizando software como Audacity, pero agrega tiempo para desarrollar la habilidad.

La grabación de sonidos de alta calidad también puede ser un desafío. Existen aplicaciones para dispositivos móviles que permiten la grabación, pero el acceso a una amplia variedad de sonidos es difícil. Por ejemplo, grabar el rugido de un avión o el sonido que hace un elefante.

Alternativamente, un desarrollador de Alexa puede buscar sonidos que hayan sido grabados por otros. Hay algunos repositorios en Internet que los tienen, pero la licencia de la mayoría cuesta dinero y es necesario volver a muestrear con software como Audacity para obtener los atributos de sonido correctos.

Contenido MP3 gratuito

Amazon ha publicado ahora un catálogo de cientos de sonidos ya grabados bajo los estándares exactos requeridos por la plataforma. Al igual que en el diagrama de arquitectura anterior, se publican en un bucket de S3 en AWS y pueden ser utilizados por cualquier habilidad personalizada.

La lista completa se proporciona en la página del desarrollador, y aquí están las categorías principales.

La gama es amplia. Motores de motocicletas, ruidos de fuegos artificiales y el rugido de un oso están a su alcance. No se requieren regalías por usarlos y el costo de descargar los clips de sonido no se carga a su cuenta de AWS.

Cómo usar el sonido en una habilidad básica

Si recién está comenzando con Amazon Alexa, comience con las plantillas básicas de la página de Alexa GitHub. Esto incluye desarrollar una habilidad de trivia, habilidad de hechos o simples juegos de adivinanzas. Por ejemplo, recientemente publiqué una habilidad divertida para niños llamada Easter Egg Hunt. Aquí está el repositorio completo en GitHub, que incluye tanto la función Lambda como el modelo de intención.

Con cualquiera de las respuestas de mensaje, puede agregar la sintaxis SSML para incluir el enlace al archivo MP3 en el depósito S3. A continuación se muestra un ejemplo del controlador de bienvenida para la habilidad Huevo de Pascua.

// This is the initial welcome message var welcomeMessage = "Welcome to the Easter Bunny Egg Hiding Game. I will ask you multiple questions that you should answer yes or no. Based on your choices, I will make a recommendation on where to hide an egg. Are you ready to begin?"; this.emit(':ask', welcomeMessage, repeatWelcomeMessage);

Cuando el usuario invoca por primera vez esta habilidad personalizada, el dispositivo Alexa reproduce el clip de sonido del corneta de la trompeta y luego lee la sintaxis con la voz estándar.

¿Listo para empezar?

¡Anímate y regístrate para obtener una cuenta de desarrollador gratuita en Amazon y comienza a desarrollar tu primera habilidad hoy! El blog de desarrolladores de Amazon tiene excelentes recursos para aprovechar este tema, incluida esta publicación reciente que brinda ideas sobre cómo usar este nuevo contenido.