Skip to content

A Tecnologia que revolucionou o mercado

A tecnologia Voz sobre IP chegou na década de 90 para as corporações. No Brasil, os projetos começaram a ganhar espaço entre 2002 e 2003. A redução de custos permitida por meio da voz sobre IP não era tão percebida em 2001, quando os telefones IP custavam em torno de U$ 800,00.

Passar voz sobre uma rede de dados não é coisa do futuro. Enganam-se aqueles que ainda acham a telefonia IP (Internet Protocol) é algo inatingível. O uso efetivo da tecnologia foi impulsionado com as distribuições VoIP como Asterisk, OpenSips, Trixbox, Elastix (Issabel), SNEP, etc. Hoje o custo dos terminais IP cairam para U$ 100,00, e ainda há opção de usar handset para substituir o Telefone IP. 

Atualmente há diversas formas para economizar com as ligações de Longa Distância Nacional (LDN) e as Ligações de Longa Distância Internacional (LDI), sendo inconsebível utilizar uma operadora para fazer isso. Temos o VoIP em aplicativos como Whatsup, Facebook, Telegram, Messager, Skype, WebEx, etc. A eles podem ser adicionados
outros como videochamada, webconference, UM
(Unified Messaging), etc.
A evolução para a terceira geração também estimulou a adesão à tecnologia, já que temos disponíveis a possibilidade de controle de voz pelo usuário; a oferta de serviços de voz e dados compartilhados em um mesmo meio físico e a ampliação da oferta de acesso à banda larga. 

Codificação VoIP

A transmissão analógica não é eficiente por ter problema com ruído de linha. Assim os sinais analógicos são degradados com a distância, precisam ser amplificados periodicamente. O que ocorre é que o ruído de linha também amplificado resultando na perda de qualidade do som transmitido. Em resposta, é usada a transmissão digital com modulação PCM (Pulse Code Modulation) ou ADPCM (Adaptative Differencial PCM ). Em ambos os casos, o som analógico é convertido em digital a uma taxa de 8000 amostras por segundo.

SIP – Session Inicialization Protocol

O protocolo SIP (Session Initiation Protocol) foi desenvolvido pelo IETF (Internet Engineering Task Force) é baseado no conceito cliente/servidor, com características muito similares ao HTTP. Utiliza mensagens (pergunta/resposta). Opera de uma forma mais simples e rápida com relação ao H.323.

H.323

O padrão H.323 é parte da família de recomendações ITU-T H.32x, que pertence a série H da ITU-T, foi criado para padronizar o sistema de telefonia na Europa e ao mesmo tempo oferecer um serviço multimidia.

Telefonia analógica usa freqüências que são captadas pelo ouvido humano (300Hz – 3400Hz).

Se você multiplicar as palavras de oito bits por 8.000 vezes por segundo, obterá 64.000 bits por
segundo (bps). A base para a infraestrutura de telefonia é 64.000 bps (ou 64 kbps).
Duas variações básicas do PCM de 64 kbps são comumente usadas:

  • µ-law, o padrão usado na América do Norte; e a-law, o padrão usado na Europa. Os métodos são semelhantes em que ambos use compressão logarítmica para alcançar de 12 a 13 bits de qualidade PCM linear em apenas palavras de oito bits, mas diferem em detalhes relativamente menores.
  • O µ-law é um método que tem uma ligeira vantagem sobre o método a-law em termos de desempenho da relação sinal-ruído de baixo nível, por exemplo.

Funcionamento do VoIP 

Com o lançamento da tecnologia de Voz sobre TCP/IP, abriu-se uma nova opção para utilizarmos voz e dados no mesmo canal de comunicação, sem a necessidade de implementarmos multiplexadores estatísticos na solução.

Na realidade a solução é bastante simples do ponto de vista tecnológicos e bastante atrativa do ponto de vista de performance e utilização. Utiliza-se como hardware um roteador com suporte para voz sobre TCP/IP, que recebe os canais de voz a partir de uma placa tronco de uma central PABX digital.

Através de parâmetros de configuração estabelece-se a quantidade máxima de canais virtuais  de voz que irão ser estabelecidos numa determinada seção. Quando um usuário tecla um código de rota  que identifica para a central a necessidade de comunicar-se com outra unidade, é iniciado o procedimento de abertura de um canal de comunicação de voz sobre TCP/IP, que ocupará uma banda de 8 kb durante o tempo da conversação. Pode-se estabelecer-se a quantidade máxima de canais de comunicação de voz simultâneos, para não degradar demais os dados que trafegam pelo mesmo link.

Para que se tenha uma transmissão de voz dentro da rede, o VoIP captura a voz, que é transmitida de forma analógica e a transforma em pacotes de dados, que são enviados por qualquer rede TCP/IP. Desta forma, é possível trabalhar com esses pacotes pela Internet. Quando o destino recebe os pacotes, estes são transformados em sinais analógicos e transmitidos de uma maneira que seja possível de ouvir.

Para que a tecnologia VoIP funcione bem deve-se ter um investimento com o serviço de QOS, ou seja, qualidade de serviço que irá priorizar a voz dentro da rede. Para que isto se torne possível, a solução é o aumento da largura de banda, ou seja, o aumento da velocidade de transmissão e recepção de dados. Como o acesso á Internet em banda larga é cada vez mais comum, principalmente em empresas, o VoIP passou a se beneficiar disso. Apesar da velocidade ser um ponto importante ela não é suficiente.

 Voz

Podemos definir a voz humana como uma forma de onda mecânica com freqüências principais na faixa que vai de 300 Hz a 3,4 kHz. Quando tratamos de voz para telefonia temos uma grande preocupação com a reprodução com a distância do terminal receptor,  pois podemos perder em termos de qualidade.

Já para a telefonia digital, como próprio nome já diz a voz é codificada em formato digital, que é multiplexado no tempo de forma a compartilhar meios de transmissão. Com o sinal digital de áudio a telefonia tem um grande ganho em termos de performance, tendo vantagens como: baixa taxa de ruído, uma certa estabilidade e reprodutividade.

QoS – Qualidade de Serviço

O QoS é a qualidade de serviço na rede. A qualidade de serviço nas redes IP é um ponto muito importante para um bom desempenho do começo ao fim das aplicações em VoIP. É necessário um conhecimento dos mecanismos utilizados, parâmetros, algoritmos e protocolos, para que se tenha uma QoS que tenha um resultado dentro da rede.

É necessário exigir determinados parâmetros o qual é um requisito da QoS como: (atrasos, vazão, perdas, …) .

Quando o QoS é solicitado, a aplicação recebe o nome de SLA

(Service Level Agreement) . Esta solicitação defini quais parâmetros devem ser garantidos para que as aplicações possam ser executadas com qualidade.

RTP – Real Time Protocol

É um protocolo que proporciona um serviço de entrega fim-a-fim para dados com característica de tempo real como o áudio e vídeo.

O RTP é utilizado em conjunto com o RTCP Real Time Control Protocol. Enquanto o RTP conduz as transmissões de mídia (ex., audio e video), RTCP é utilizado para monitorar estatísticas e qualidade de serviço (QoS) e auxilia a transmissão do múltiplas transmissões. RTP é originado e recebido em números port iguais e comunicação RTCP associada utiliza o próximo maior número port. O RTP é uma das fundações do VoIP e é utilizado em conjunto com SIP que auxilia na configuração das conexões de rede.

Proporciona identificação de tipo de payload, numeração sequencial, informação de tempo ( timestamping ) e monitoração da entrega. Não contém mecanismo para entrega em tempo adequado, nem garante qualidade de serviço, não garante nem a entrega e nem uma seqüência ordenada de entrada, suporta transferência de dados para múltiplos destinos (multicast) se a rede de transporte oferecer também esse serviço, permitindo aplicações como armazenagem de dados em seqüência, simulação interativa distribuída, medições e controle.

RTCP – Real Time Control Protocol

RTCP significa em inglês Real Time Transport Control Protocol (Protocolo de Controle de Transporte em Tempo Real) definido pela RFC 3550. O RTCP funciona juntamente com o RTP. O RTP realiza a entrega dos dados, enquanto o RTCP envia pacotes de controle aos participantes de uma chamada. Sua função principal é fornecer um feedback da qualidade dos serviços oferecidos pelo RTP.É um protocolo que atua em conjunto com RTP exercendo as funções de controle. Sua principal função é fazer a realimentação da qualidade da entrega e conduzir informações sobre os participantes em uma sessão em andamento.

CODEC

O CODEC é o acrônimo de Codificador e Decodificar de dados ele é necessário para codificar e decoficar a voz humana de analógica para digital e vice-versa

Este componente é o responsável por transformar a voz humana (um sinal analógico) em uma seqüência de bits (um sinal digital) para transmissão numa rede de dados, fazendo amostragens periódicas no sinal de voz. Em equipamentos do tipo gateways VoIP, esses CODECs são implementados através de um componente chamado DSP (Digital Signal Processor).

A introdução dos microprocessadores no final dos anos 70 e início dos anos 80 tornou possível usar técnicas de processamento digital de sinais (Digital Signal Processing) em um range muito maior de aplicações.

Como um microprocessador de uso geral, um DSP é um dispositivo programável, com seu próprio conjunto de instruções nativas. O uso desses chips associados a algoritmos de compressão permitiu a implementação de diversas tecnologias de CODEC’s. Exemplos de chips DSP são o DSP542 e DSP549 fabricados pela Texas Instruments e usados pela CISCO Systems em seus gateways VoIP.

Cada CODEC provê certa compressão e qualidade na transmissão da voz. A medida de qualidade da voz transmitida é uma resposta subjetiva de um ouvinte. Uma medida comum usada para determinar a qualidade do som produzido pelos CODECs específicos é o MOS (Mean Opinion Score). Com o uso do MOS, um amplo range de ouvintes julgam a qualidade de uma amostra de voz (correspondendo a um CODEC particular) numa escala de 1 a 5. A partir desses resultados, é calculada a média dos scores para atribuir o MOS para aquela amostra.

CODECs DE VOZ

G.711

–Descreve a técnica de codificação de voz através do padrão PCM, criando canais de voz digital de 64 Kbps.

–A voz codificada nesse formato é adequada  para a transmissão de voz digital em redes de telefonia públicas ou através de PBXs (Private Branch eXchanges).

–Possui dois Sub padrões:

  • U-Law (EUA e Japão)
  • A-Law (Europa).

–Comprime amostras PCM com 14 ou 13 bits em 8 bits de escala logarítmica, gerando 64 Kbit/s.

G.723.1

–Este codec foi regulamentado pela ITU-T em 1995. Usa extensões do G.721.

–Codifica o sinal em trechos de 30ms, perdendo ainda cerca de 7.5ms para execução do algoritmo, resultando em um delay esperado de 37.5ms por frame.

–O G.723.1 pode operar sob dois tipos de algoritmos:

  • MPC-MLQ – Realiza a transmissão a uma taxa de 6.3 kbit/s (24 byte por frame), sem perder muito em qualidade.
  • ACELP – Realiza a transmissão a uma taxa mais baixa que o MPC-MLQ, cerca de 5.3 kbit/s (20 byte por frame), acarretando a uma pequena perda na qualidade e um maior esforço computacional.

A principal característica do CODEC G.723.1 é a necessidade de uma banda pequena para transportar os pacotes  (cerca de 20kbps), o esforço computacional para executá-lo fica em torno de 16MIPS ou 2.2 kbytes de RAM para codificar.

Música e tons (DTMF e fax, por exemplo) não podem ser transportados por esse CODEC, para isso outro codec precisa ser utilizado tal como G.711.

Esse CODEC nos períodos de silêncio faz com que apenas a informação do ruído ambiente seja enviada no período de atividade, a uma taxa inferior a taxa de codificação. O envio dessa informação cessa a partir do momento em que não ocorrem variações significativas na mesma. Assim o decodificador restaura essa informação a partir de amostras previamente recebidas.

G.726

–É um CODEC usado a algum tempo, substituiu o CODEC G.721, que se tornou obsoleto.

–Essa codificação utiliza o algoritmo ADPCM.

–Pode operar com diferentes taxas de compressão da voz  40, 32, 24 e 16 Kbps.

–Ele possui uma qualidade praticamente idêntica a do G.711.

–Perdeu espaço durante os anos 90, devido a sua incapacidade de trabalhar com sinais de modem e de fax.

–Ainda desperta o interesse, pois requer pouco processamento.

G.728

–É um padrão ITU-T para a operação de codificação de voz em 16 kbit/s.  Ele é popularmente conhecido como codificação de voz em 16 kbit/s.

–Esse padrão descreve uma variação da compressão de voz CELP Code Excited Linear Prediction de baixa latência.

–Utiliza o algoritmo LD-CELP (Low Delay Code Excited Linear Prediction).

A tecnologia usada é o algoritmo LD-CELP, caracterizado pelo seu baixo atraso (Delay).

O delay do CODEC é de apenas 5 amostras (0,625 ms).

A complexidade do CODEC é de 30 MIPS. Para o seu processamento é necessário 2 kilobytes de memória RAM.

Com relação a sua qualidade, o CODEC possui um MOS (Mean Opinion Score) de 3.61.

G.729

–Padrão padronizado pelo ITU-T.

–Descreve uma  compressão da voz em fluxos de 8 kbps.

–Utiliza o algoritmo CELP

–Possui diversas variações desse padrão (Anexos).

– Os anexos diferem com relação a complexidade computacional e a qualidade de conversação.

O CODEC G.729 codifica o sinal em trechos de 10 ms perdendo ainda cerca de 5ms para execução do algoritmo, resultando em um delay esperado de 15 ms por frame. Música e tons (DTMF e fax, por exemplo) não podem ser transportados por esse CODEC, para isso outro codec precisa ser utilizado tal como G.711.

O padrão opera a uma taxa de 8 kbit/s (8 bytes por quadro), no entanto existem extensões que podem diminuir ou aumentar esta taxa. Utiliza como algoritmo de codificação e decodificação o CS-ACELP (Conjugate-Structure Algebraic Code Excited Linear Prediction), uma extensão do ACELP.

Além disso, esse CODEC dá suporte a áudio e vídeo conferência.

Ele foi desenvolvido pelo consórcio de empresas:

  • France Telecom
  • Mitsubishi Electric Corporation
  • Nippon Telegraph and Telephone Corporation (NTT)
  • Université de Sherbrooke

G.729a (Annex A)

–Usa a frequência de amostragem 8 kHz/16 bits (80 amostras de 10 quadros ms).

–A taxa de bits fixa (8 kbit / s 10 quadros ms).

–Tamanho do quadro fixo (10 bytes por 10 quadros ms).

–Atraso algorítmico é de 15 ms por frame, com 5 ms de antecipação de atraso.

–Usa o algoritmo ACELP (Algebraic Code Excited Linear Prediction).

A alta complexidade do algoritmo utilizado no CODEC G.729  (CS-ACELP ), levou a necessidade de se otimizar o algoritmo, pois uma grande força computacional da máquina do usuário era necessária para realizar a codificação (principalmente) dos sinais. O objetivo dessa extensão é contornar isso, reduzindo a complexidade do algoritmo o G.729.

A complexidade do algoritmo G.729a é avaliada em 15, usando uma escala relativa, onde os CODEC G.711 e G.723.1 alcançam a nota 25.

G.729b (Annex B)

–O anexo B é uma extensão do CODEC G.729.

–O G.729b é a implementação de três elementos que tem por objetivo retirar da entrada sons inúteis, selecionando com critério o que será transportado, são eles:

1.VAD (Voice Activity Detection) – Módulo que tem por finalidade detectar a voz humana para só assim permitir a transmissão.

2.DTX (Discontinuous Transmission) – Módulo que detecta ruídos ambientais eliminando-os da transmissão.

3.CNG (Confort Noise Generator) – Módulo do decodificador que adiciona ao som do ouvinte um ruído de conforto existem em ligações PSTN.

G.729c (Annex C)

–O anexo C é também uma extensão do CODEC G.729.

–Esse CODEC utiliza um processamento por ponto flutuante, para assim como o G.729a, reduzir a complexidade do algoritmo CS-ACELP.

O anexo C contém a descrição de algoritmos, em ponto flutuante, para os codificadores G.729 original e G.729 Anexo A.

Existe uma versão chamada anexo C+ que integra o G.729 original com os anexos B, D e E em um algoritmo, em ponto flutuante, formando um codificador em compressão de silêncio e com taxa de transmissão de 4, 6, 8 ou 11,8 kbit/s.

G.729d (Annex D)

–Contém a descrição de um algoritmo para codificação de sinais de fala a 6,4 kbit/s baseado na técnica CS-ACELP.

G.729f (Annex F)

–Inclui a função de compressão de silêncio do Anexo B no algoritmo do codificador G.729d Anexo D.

G.729g (Annex G)

–Inclui a função de compressão de silêncio do Anexo B no algoritmo do codificador G.729 Anexo E.

G.729h (Annex H)

–Contém a descrição de um algoritmo que integra o G.729 original com os Anexos D e E, formando um codificador de transmissão de 4, 6, 8 ou 11,8 kbit/s.

G.729i (Annex I)

–Contém a descrição de um algoritmo que integra o G.729 original com os Anexos B, D e E, formando um codificador com compressão de silêncio e taxa de transmissão de 4, 6, 8 ou 11 kbit/s.

G.729j (Annex J)

–Contém a descrição de uma extensão do algoritmo G.729 com taxa de transmissão de 8 a 32 kbit/s.

–O G.729j também é conhecido por G.729.1.

ILBC – Internet Low Bitrate Codec

–É definido através da RFC 3951.

–Contém a descrição de um algoritmo que integra o G.729 original com os Anexos B, D e E, formando um codificador com compressão de silêncio e taxa de transmissão de 4, 6, 8 ou 11 kbit/s.

–Qualidade básica mais alta que o G.729a com complexidade equivalente.

–Maiores informações http://www.ilbcfreeware.org, importante consultar para verificar os pós e contras.

–É uma solução aberta, livre e isenta de royalties.

É um CODEC do tipo royalty-free, para ser utilizado em banda estreita, foi desenvolvido pela Global IP Solutions (GIPS), antigamente Global IP Sound.

É adequado para aplicações de VoIP, streaming de áudio, arquivos e mensagens.

Opera com um algoritmo é uma versão do tipo block-independent linear predictive coding, com a amostra de frames de 20 e 30 milissegundos. Os blocos codificados serão encapsulados em um protocolo adequado para o transporte, normalmente, o Real-time Transport Protocol (RTP).

iLBC trata o caso de quadros perdidos através de uma degradação elegante da qualidade voz.

Os frames perdidos geralmente ocorrem em ligação com perda ou atraso de pacotes IP.

É um dos CODECS utilizados por Skype, Gizmo5, Ekiga, QuteCom, Google Talk, Messenger, telefone IP da Polycom e Maemo Recorder (na Nokia N800/N810) e muitos outros.

INTERFACES

Interfaces LAN

Interfaces Digitais

Essas interfaces permitem que os telefones e computadores se conectem ao servidor PABX IP. A interface Digital é a Ethernet (Fast e Giga). Na prática é reaproveitado o cabeamento estruturado da empresa, sem precisar fazer nenhuma modificação.

Interfaces Analógicas

FXS e FXO são as portas usadas por linhas de telefonia analógica que fazem a conexão com a RTPC – (Rede Telefonica Pública Comutada).

FXS – Foreign eXchange Subscriber. É a interface que fornece o “TOM” para a linha analógica ao assinante. Em outras palavras, é como se fosse o “plug” para a Rede da Operadora, que fornece o tom de discagem, corrente de energia e som.

FXO – Foreign eXchange Office. É a interface que recebe a linha analógica. É o plug no telefone analógico. Indica se o telefone está no gancho/fora do gancho (circuito fechado). Como a porta FXO está ligada a um dispositivo, esse dispositivo é normalmente chamado de “dispositivo FXO”.

FXO e FXS estão sempre em pares, de modo semelhante a um plug macho / fêmea. Sem um PBX, um telefone fica conectado diretamente à porta FXS fornecida por uma companhia telefônica.

Quando houver um telefone analógico e você precisar conectá-lo a um switch, é necessário ter um adaptador denominado de ATA – Adaptador de Terminal Anaógico.

Interfaces WAN

INTERFACE E1

Como o próprio termo diz, interface é algo que está entre duas faces. Ela serve para fazer a conexão entre os periféricos com o PABX IP (telefone, computadores, etc.) e do servidor para a Rede Telefonica Pública Comutada, em função disso há interfaces LAN e WAN. Também há interfaces analógicas e digitais.

INTERFACE ISDN

Essa interface não é muito comum no Brasil, mas em determinadas cidades ela é disponibilizada, é similar a Interface E1 Também possui 30 canais de voz de 64 Kbits/s

O “Cartão ISDN” ou Placa ISDN é muito mais cara que a placa E1 (que está em torno de U$ 1.000,00). Essa interace é conectada ao barramento PCI ou PCI-E do Servidor PABX IP.