Gestão na Era da Inteligência Artificial: Building Blocks
Bem-vindos a Gestão na Era da Inteligência Artificial!
Esta série aborda, de forma simples e acessível, os fundamentos da inteligência artificial, suas aplicações na gestão de operações e projetos e como se preparar para lidar com esse novo paradigma.
No primeiro post, você teve contato com os conceitos básicos e exemplos de aplicações, chegou a hora de conhecer os building blocks, serviços prontos para integrar aos seus sistemas.
Neste post, apresento um panorama geral do ecossistema de inteligência artificial, elenco os principais players e suas plataformas, os building blocks e um exemplo de utilização.
—
Ecossistema
Existem milhares de empresas atuando na área de inteligência artificial, o quadro da Shivonzillis (abaixo) apresenta um landscape das empresas, segmentadas por área de atuação.
Machine Inteligence Landscape – AI-ONE.com
Boa parte dessas empresas atua sobre problemas específicos e tem soluções prontas para uso, outras disponibilizam serviços para integração em suas plataformas.
Um web service é um trecho de software disponível na internet . São serviços modulares, autocontidos e distribuídos dinamicamente, de modo que possam facilmente ser integrados a quaisquer sistemas que tenham autorização para utilizá-los.
Embora os players e os serviços tendam a mudar ao longo do tempo, neste post comento sobre as 4 plataformas generalistas que lideram o mercado.
Principais players
Na atualidade, os principais players são IBM, Microsoft, Google e Amazon.
Todos eles possuem plataformas com diversas utilidades como hospedagem de software, bancos de dados, big data e IOT. Em geral, possuem seções nas plataformas dedicadas a inteligência artificial.
- A plataforma da IBM é o BlueMix e sua seção dedicada a IA é o Watson, um conjunto de webservices cobrindo aspectos da linguagem natural, indexação e visão computacional.
- Na Microsoft, a plataforma se chama Azure e tem uma cobertura de IA muito similar a do Watson. Seu sistema mais famoso, um processador de linguagem natural, se chama LUIS (Language Understanding Intelligent Service).
- A Google possui o Google Cloud Services, também uma plataforma genérica para venda de plataforma como serviço (PaaS) e o Tensorflow, que é um framework gratuito para desenvolvimento de redes neurais.
- Na Amazon Web Services também há uma seção dedicada a IA, que comporta serviços de voz, imagens e vídeos.
Building Blocks
A partir das informações extraídas dessas principais plataformas, apresento um conjunto de building blocks, serviços integráveis pagos por uso. Em geral, são apenas alguns centavos para utilizar cada serviço mais os custos de hospedagem dos servidores (mas isso vamos deixar para o pessoal técnico! rs)
Os principais building blocks e as descrições de suas utilidades apresento a seguir, enfocando na ação que cada serviço é capaz de fazer.
Linguagem Natural
O processamento de linguagem natural comporta todas as habilidades necessárias para compreender textos e voz.
Entender | Detectar a intenção do usuário (o que ele deseja dizer) |
Escrever | Transformar voz em texto |
Falar | Transformar texto em voz |
Detectar idioma | Detectar o idioma de um texto |
Traduzir | Traduzir de um idioma para outro |
Classificar | Identificar categorias entre os elementos de um texto (palavras-chave, autores, conceitos associados, datas, formatos, links de origem etc) |
Entidades | Identificar as entidades importantes de um texto (pessoas, lugares, organizações etc) |
Relações | Identificar sujeitos, ações e objetos diretos em sentenças |
Emoções | Detectar se a emoção associada a um texto é positiva, neutra ou negativa |
Sentimentos | Detectar atitude, opinião ou sentimentos associados a um texto (raiva, medo, alegria, nojo) |
Visão Computacional
A visão computacional tem sido organizada em dois grupos: imagens e vídeos. Ambos abordam o reconhecimento de entidades (objetos, pessoas e locais), a captura de texto e outras funções específicas como a detecção de conteúdo explícito.
Imagens
Objetos | Identificar um objeto (e a probabilidade da identificação estar correta) |
Locais | Identificar locais conhecidos (pontos de referência) |
Pessoas | Detectar faces numa imagem e inferir sexo, idade, localização, identidade e categorizar identidades (políticos, artistas, empresários etc) |
OCR | Transformar caracteres de uma imagem em texto |
Atributos | Detectar atributos gerais como cores dominantes e sugestões de recorte |
Vídeos
Objetos | Dado um trecho de vídeo, detectar conjuntos de objetos como flores, animais, meios de transporte etc. |
Região | Detectar a região onde um vídeo foi filmado (us-east1, us-west1, europe-west1, asia-east1) |
Entidades Customizadas | Dado um trecho de vídeo, detectar entidades pré-cadastradas |
Mudanças de cena | Detectar se houve uma mudança de cena num trecho de vídeo |
Conteúdo impróprio | Detectar conteúdo impróprio, identificados através de colaboração |
Personalidade
Baseada nos testes psicológicos já bem consolidados, a IBM construiu uma API capaz de detectar traços de personalidade a partir de 1.200 palavras. Traitify e Crystal são algumas das dezenas de soluções alternativas, porém não integráveis.
Personalidade | A partir de um trecho de texto com +- 1.200 palavras, traz informações sobre a personalidade (amabilidade, consciência, extroversão, faixa emocional e abertura), necessidades (harmonia, curiosidade, estabilidade, auto-expressão, proximidade) e valores (tradição, estimulação, apoio aos outros, realização). |
No artigo “Watson, me diga quem sou“, apresento os resultados detalhados do uso da personality insights da IBM aplicados a grande personalidades como Shakespeare, Nietzche, Napoleon Hill etc.
Exemplo
No artigo artificial intelligence applications: data science meets procurement, Prakash apresenta a problemática de uma área de procurement global.
A autora disserta sobre a importância da área de aquisições, que é responsável por todas as despesas da empresa, exceto pessoas. Aponta quanta economia pode ser feita através de contratos delineados globalmente, seleção de fornecedores e políticas de consumo adequadas a otimização de recursos financeiros.
Desafio
Seu principal desafio é classificar e avaliar contratos, compras, notas fiscais e reembolsos em diversos países e idiomas.
Juntando os blocos
A integração de sistemas globais é um capítulo à parte, quem viveu a implantação de um SAP sabe muito bem. No nosso contexto de estudo, no entanto, enfoquemos em como resolver a classificação dos documentos citados.
O primeiro aspecto a observar é unificação dos dados, o que significa ter todos os documentos acessíveis à ferramenta de inteligência artificial. Isso poderia ser feito através de um data lake, de um banco de dados e até de uma pasta compartilhada.
No entanto, alguns dos documentos precisam ser escaneados e as imagens devem ser transformadas em texto para que seja feita a classificação. Neste caso, podemos usar o OCR, da seção de visão computacional, para transformar imagens em textos.
Como os documentos estão em múltiplos idiomas, é preciso traduzí-los. Para isso, podemos utilizar um webservice de tradução de texto, disponível na maioria das plataformas.
Identificar a origem do documento e seu responsável, se já não estiver cadastrado previamente, pode ser realizado através da identificação de entidades. Para tal, é preciso conduzir um processo de annotation, para listá-las e “ensinar” à ferramenta, tarefa realizável, por exemplo, através do Watson Knowledge Studio.
A penúltima etapa é um pouco mais trabalhosa, mas não complexa: classificar os documentos. Para isso é preciso “treinar” o computador para entender a relação entre um texto descrito e sua categoria.
Avaliação final
Por fim, com todos os dados unificados numa única visão (uma planilha que seja), basta fazer as análises de prós e contras e decidir quais fornecedores, contratos e políticas devem permanecer ativos.
Ok, você pode dizer que a inteligência artificial não resolveu a análise. Mas, observe as possibilidades!
Juntar informações numa escala global é um trabalho quase impossível, para isso, contam-se com os sistemas. Mas, há que se levar em consideração que seres humanos são passíveis de erro, especialmente quando não estão muito empenhados num tema como cadastrar reembolsos. Neste caso, o processo de classificação automático tende a aumentar drasticamente a acurácia e, com ela, a efetividade do processo de procurement.
—
Bem, por enquanto é isso. Nos posts seguintes apresentarei mais conceitos e exemplos.
Eli
—
Referências
- AI-ONE. ai-one and the Machine Intelligence Landscape.
- ALTEXSOFT. Comparing Machine Learning as a Service: Amazon, Microsoft Azure, Google Prediction API.
- AMAZON. Machine learning on AWS.
- DATAMATION. Top 20 Artficial Intelligence Companies.
- Google Cloud Platform, Video Intelligence – Shot change detection.
- Google Cloud, Computer Vision,
- HARDESTY, Larry. Learnig words from pictures. MIT News, 2016.
- IBM. Alchemy Language
- IBM. Bluemix Docs.
- IBM. Visual Recognition
- IBM. Watson products and services.
- MICROSOFT. Language Understanding Intelligent Service.
- MICROSOFT. Azure cognitive services.
- PRAKASH, Shamli. Artificial intelligence applications: data science meets procurement. Medium, 2017.
- RODRIGUES, Eli. Watson, me diga quem sou!. Tudo mobile, 2017.
- Tutorials Point. What are Web Services.