De
laatste maanden zie ik IP-telefonie weer overal opduiken. Het is
voor velen echter de vraag of we nu in de "hype" fase zitten of
dat er al serieus iets aan de hand is.
De 'hype' fase die men nu ziet is de "tweede hype". Dat is de fase
waarin leveranciers hun afgeronde producten gaan slijten. Zo ben
ik al meerdere keren via IP-telefonie opgebeld vanaf een beurs,
waar dus weer eens een systeem werd gedemonstreerd door het te koppelen
aan het telefoonnet.
De eerste hype was in 1996, ongeveer een jaar nadat het Israelische
bedrijf Vocaltec zijn software-programma
IP-phone verspreidde. Dat programma werd door velen als een amusante
Internetvorm van de 27MC-band werd afgedaan. In hoofdzaak omdat
er met de meeste geluidskaarten en PC's alleen in half-duplex (over!..)
kon worden gesproken.
Na korte tijd kwam er echter een volledige duplex-versie en zagen
de eerste pioniers een nieuwe markt gloren. Roeptoeter van het eerste
uur is Jeff Pulver, die op
16 oktober 1995 de Free World Dial-up mailinglist startte. Zijn
doel was om samen met een vriendje in Tokio geluidskaarten van PC's
aan het telefoonnet te koppelen om zo wereldwijd gratis telefoneren
over het Internet mogelijk te maken.
Pulver transformeerde zich in drie jaar tot organisator van conferenties
en spreker. In de laatste hoedanigheid leidde hij op vrijdag 13
november 1998 een workshop in het Barbizon hotel in Amsterdam als
slot van een groot driedaags internationaal congres over IP-telefonie.
De meesten zullen dat congres vermoedelijk net als de pers hebben
laten passeren/gemist hebben.
Het is echter nuttiger om eens iets realistischer naar Voice-over-IP
te kijken en te bepalen wat nu werkelijk de mogelijkheden zijn van
deze technologie.
Het valt op dat er steeds een hardnekkige mythe over IP-telefonie
blijft rondzingen in de markt. Het kostenvoordeel van IP-telefonie
zou zitten in de te gebruiken tranmissiebandbreedte. IP-telefonie
zou daarmee veel goedkoper zou zijn dan de technieken die telefoonmaatschappijen
toepassen.
De efficiëntie van IP-telefonie zou dan komen door het gebruik
van spraakinterpolatie en compressie van het digitale gesproken
woord.
Spraakinterpolatie is het gebruiken van bandbreedte voor andere
gesprekken tijdens stiltes van één of beide sprekers.
Tijdens een typisch telefoongesprek zijn sprekers om de beurt aan
het woord en wordt zo'n 40 procent van de tijd effectief benut.
De meeste telefoneerders zijn klaarblijkelijk beschaafd en luisteren.
Wie kijkt op de pagina's over Digital
Circuit Multiplying Equipment (DCME) van het Israelische ECI
Telecom (sic!) begrijpt dat er echter minder nieuws onder de zon
is dan wordt gedacht. Apparatuur die spraak kan comprimeren en interpoleren
tijdens stiltes van een spreker is al in 1988 op de TAT-8 transatlantische
zeekabel toegepast.
Met een investering in DCME van een paar ton kan ook nu nog steeds
ruim een miljoen gulden per jaar worden bespaard op het huren van
2 Mbit/s verbindingen van Europa naar de Verenigde Staten. Telefoonbedrijven
hielden deze technische truc gewoon goed verborgen voor de beller,
die dacht namelijk dat hij via de satelliet belde en accepteerde
daarom echo's en het "clippen" van het eerste woord c.q. lettergreep
als de ander weer begon te spreken.
Sinds 1988 zijn de digitale signaalverwerkers (DSP's) in de DCME-apparatuur
verbeterd en is echovereffening in plaats van echo-onderdukking
doorgevoerd, zodat er nu niet meer hoorbaar "geclipt" wordt. Fax-,
modem- en ISDN-dataverkeer ondervinden geen hinder van deze 'goedkope
technologie': dataverkeer wordt bij de betere compressie-apparatuur
herkend, gefilterd en via aparte datalinks met de werkelijke bandbreedte
doorgestuurd.
Transport van telefoongesprekken over kabels kan echter nog goedkoper
dan met DCME. Sommige prijsstunters plaatsen goedkope transcoders
van een paar duizend gulden. Deze herkennen echter geen faxen en
modems. Bij transcoders schakelen faxen en modems terug tot 2400
bit/s.
En dat heeft weer tot gevolg dat de verbinding drie tot vier keer
zo lang open staat. Hiermee wordt een tarief naar de VS voor faxen
drie tot vier keer zo duur! Ik ken wel een paar Nederlandse bedrijven,
die de afgelopen 3 jaar op deze wijze in de boot zijn genomen door
een prijsstuntende telefonie-aanbieder.
Vooral nu er felle concurrentie op de internationale telefoonroutes
is ontstaan, moet je als klant argwanend zijn. Teveel mensen gaan
nog voetstoots er van uit dat de kwaliteit van telefonie eenduidig
is en dat het onderscheid vooral wordt gemaakt in de facturering
en service. Dat is niet het geval.
Ik krijg af en toe grossiersprijzen onder ogen waar ik me bij achter
de oren krab. Ik heb soms toegang tot de besloten beurzen waar telecombedrijven
transportvolumes uitwisselen, voorbeelden van dergelijke beurzen
zijn Band-X; Rate
eXchange of het Nederlandse InterXion.
Daar wordt gehandeld in "grossiers-minuten" voor 'gewoon telefoonverkeer',
dat wil zeggen 'circuit-geschakeld', over telefooncentrales.
Er zijn sinds kort ook beurzen waar spraak over Internet (dus over
pakketgeschakelde netwerken) wordt verhandeld (IP): Rate
eXchange heeft zo'n beurs en Jeff Pulver (alweer) runt Min-X.com
. Deze kennen indachtig de opener cultuur van Internet voor iedereen
zichtbare spotrate
price boards. Wat blijkt nu?
De grossiers-prijzen voor het minuten traditioneel telefonietransport
liggen in de praktijk nauwelijks boven de prijzen die gerekend worden
voor het transporteren van minuten spraak over pakketten data. Typisch
zo'n 7 dollarcent per minuut voor Nederland-VS.
Het beperkte prijsverschil is ook logisch. Wie naar het inwendige
kijkt van de Voice over IP apparatuur, die wordt gekoppeld met c.q.
ingebouwd in telefooncentrales, ziet dat die eveneens vol zit met
digitale signaalverwerkers (DSP's) voor spraakcompressie en het
herkennen van inbellende modems en faxen. Er is dus geen essentieel
technologisch verschil met DCME waaruit het prijsvoordeel kan worden
behaald! Alleen de afstelling van de compressiefactor blijft als
onderscheidend element over. Die wordt er dan ook op de "spraakbeurzen"
keurig bij vermeld. Op de markt voor traditioneel telefonietransport
('operator-markt') is die kwaliteit vrijwel altijd 2:1 compressie
(32 kbps) en niet 8:1 (8 kbps).
Zware 8:1 compressie wordt echter wel door de voice over IP bedrijven
en hun verkoop-adviseurs aangeraden aan bedrijven die telefonie
over hun Intranet willen laten gaan. Dat gaat dus voor verrassingen
zorgen.
De meeste telefoonbedrijven comprimeren met reden de spraak niet
verder dan 32 kbps, compressie tot 16 kbps of nog lager is namelijk
duidelijk hoorbaar. Bel maar eens met een wat ouder GSM-toestel
(standaard 13,3 kbps). De verbeterde Enhanced Full Rate codec voor
GSM is niet zonder reden op de markt gebracht.
Bekende zwakke punten van IP-telefonie zijn de vertraging die nodig
is voor de compressie van het signaal, het opvangen van de kans
dat pakketten in een onjuiste volgorde aankomen en de noodzaak om
echo's te onderdrukken of te vereffenen.
Wie wil ervaren hoe de combinatie van al die effecten werkelijk
uitpakt kan daarom het beste eens via een IP-telefonieverbinding
met hoge compressie bellen naar een GSM-nummer.
Dan krijg je een opeenstapeling van deze effecten. GSM kent namelijk
ook (een andere!) compressie en echo-vereffening. De verschillende
algoritmes werken in een keten niet zo bijster goed samen.
Wanneer in Nederland eind 2000 zo'n 6,5 miljoen mensen met een
GSM rondlopen en daarmee de vaste aansluitingen in woonhuizen overvleugelen,
dan wordt goed samenwerken met GSM de norm. Wederom een reden om
de compressie bij IP-telefonie maar niet te krap af te stellen.
De kans dat aan de andere zijde zich iemand bevindt met een GSM-toestel
wordt namelijk zeer substantieel.
Ook een leuke test is om eens met een aantal GSM's en IP-telefoons
deel te nemen aan een teleconferentie (een zakelijke babbelbox).
In de systemen voor teleconferenties zit namelijk technologie ingebouwd
die echo's en ruis wegwerkt. Natuurlijk weer met een ander algoritme.
Zodat het totaaleffect een digitale variant wordt van de "mexicaanse
hond" (rondzingen).
Het in september 1997 op de markt gebrachtte H.323 IP-telefoontoestel
van Selsius gebruikt op het
lokale netwerk (LAN) dan ook helemaal geen compressie, maar stelt
zich af op de standaard 64 kbps.
Selsius, een recent door Cisco gekocht Amerikaans bedrijf (met
Franse moeder), richt zich namelijk op het vervangen van de PABX
bij bedrijven en als je met een nieuwe techniek de bestaande PABX
(bedrijfstelefooncentrale) wil verdringen dan lever je dus niet
als eerste in op spraakkwaliteit!
Een andere verrassing is het op de markt komen van een draadloos
IP-telefoontoestel van Symbol,
bedoeld voor gebruik in een Radio-LAN. Dat wordt een fijne concurrent
voor de nu voor bedrijven en thuisgebruik beschikbare DECT-toestellen.
Symbol verkoopt dus echter iets anders dan kale Voice over IP.
De meerwaarde van IP-telefonie zit niet zozeer in concurrentie
met de geringere bandbreedte, maar vooral in de mogelijkheid dat
een variabele geluidskwaliteit ingesteld kan worden door de eindgebruiker.
In de ISDN-standaarden was een verbeterde geluidskwaliteit wel voorzien
(namelijk 7 kHz telefonie over een 64 kbps kanaal i.p.v. de standaard
3,1 kHz over een gewone telefoonlijn), maar dat vereiste speciale
(nieuwe) toestellen. Het gevolg is dat de verbeterde geluidskwaliteit
hoofdzakelijk wordt gebruikt voor gespecialiseerde marktniches,
zoals bijv.
radio-journalistiek.
Een PC met een programma voor H.323-conferencing (H.323 is de standaard
voor IP-telefonie, maar omvat veel meer dan puur telefoneren, kijk
bijv. maar eens naar het programma MicroSoft
Netmeeting) biedt de mogelijkheid voor het verhogen van de geluids-
en beeldkwaliteit tegelijk met de toename van de beschikbaar bandbreedte.
Microsoft heeft in Windows standaard codecs gestopt die van gewone
telefoonkwaliteit (3,1 kHz) tot CD-kwaliteit (22 kHz) kunnen worden
ingesteld.
GSM-toestellen kennen, in tegenstelling tot vaste telefoontoestellen,
een grote omloopsnelheid. De meeste mensen schaffen om de 2 jaar
namelijk een nieuwe aan. Vandaar dat men bij GSM wel de introductie
van verbeterde compressietechnieken wel aandurft (en concurrentie
heeft er vast ook mee te maken). De verbeterde geluidskwaliteit
wordt nu in de mobiele markt aangeboden onder de naam Enhanced Full
Rate codec.
Zaterdagmiddag liep ik tijdens het shoppen een onvervalst Telfort-promo-team
tegen het lijf, dat iedere passant als lokkertje liet bellen met
een EFR-toestel om te laten horen hoe goed dat wel klinkt.
Er blijkt nu al bij GSM een bodem in de markt te zitten aan de
acceptatie van spraakkwaliteitsverlies. Ondanks de enorme vooruitgang
in spraakcompressie-techniek kan er in de praktijk wel eens een
voorkeur ontstaan om de compressie bij te stellen naar 16, 24 of
32 kbps.
Je moet dus goed oppassen met de verhalen over compressie. Beloften
voor een kostenbesparing (terugverdientijd) van IP-telefonie op
basis van compressie van spraak tot 8 kbps vind ik daarom hoogst
dubieus.
In de spraaktelefoonwereld heeft men echter nog geen ervaring met
gebruikers die zelf de kwaliteit van de dienstverlening kunnen bepalen.
Lang geleden is ooit de spraakband van het telefoonnet vastgelegd
op 3,1 kHz en dat is sindsdien als vast gegeven beschouwd, niet
als variabele.
Dit verschilt sterk van bijvoorbeeld radio waar door groei van
AM (4,5 kHz) naar FM (15 kHz) en van mono naar stereo de geluidskwaliteit
drastisch verbeterde.
Wanneer na enige tijd op het Internet blijkt dat de meeste gebruikers
van IP-telefoonsoftware de geluidskwaliteit hoogwaardiger zetten
dan nu normaal is met een gewone telefoon, dan hoeft de markt voor
toestellen met een betere geluidskwaliteit niet meer te worden bewezen
met de "natte vinger". Een belangrijke reden waarom nog niemand
dat met ISDN aandurfde.
Internet-providers zijn zo langzamerhand al gewend om te gaan met
gebruikers die bij hogere beschikbare bandbreedtes direct de 'kwaliteitsknoppen'
omhoog draaien (beter beeld en geluid, danwel meer downloaden in
dezelfde tijd enz.enz.). Telefonie-aanbieders en beheerders van
bedrijfstelefooncentrales kennen dergelijk autonoom gedrag van 'eindgebruikers'
nog niet.
Het kunnen variëren in kwaliteit, zoals dat kan met IP-telefonie,
leidt zo in totaal wel tot meer telefoonverkeer. De instelbare spraakkwaliteit
krijgt namelijk een relatie met de prijselasticiteit van telefoneren.
Die kwaliteitsvariatie bestaat nu vrijwel niet, er is nu eigenlijk
maar één kwaliteit. Daarmee laat je altijd een deel
van de markt liggen.
Het wordt interessant of er de komende jaren toestellen, dan wel
softwareprogramma's voor IP-telefonie, komen die de geluidskwaliteit
automatisch aanpassen aan de beschikbare bandbreedte (zoals nu al
mogelijk is in RealPlayer G2
voor radio over Internet). Dat lijkt me de nachtmerrie voor elke
Intranetbeheerder. Heb je de bandbreedte van de verbinding tussen
twee vestigingen verbreed, schakelen de gebruikers automatisch in
de "hogere versnelling".
Wie IP-telefonie in zijn organisatie wil doorvoeren, moet zich
dus niet rijk rekenen aan besparingen met compressiefactoren. Zelfs
wanneer men de kans op congestie/vertraging kan beheersen, moet
men er op verdacht zijn op gebruikers die aan de kwaliteitsknoppen
gaan draaien en daarmee het verkeer opjagen. De kwaliteit op termijn
afregelen naar "hi-fi" lijkt mij een logische gang van zaken.
Dat IP-telefonie leidt tot een verlaging van de bestedingen van
een bedrijf of een consument aan telecommunicatie valt dan ook te
betwijfelen.
Hendrik Rood
senior consultant
Stratix Consulting Group