Ambisonics - Ambisonics

Ambisonicsin entinen tavaramerkki

Ambisonics on täysimittainen surround- äänimuoto: vaakasuoran tason lisäksi se kattaa äänilähteet kuuntelijan ylä- ja alapuolella.

Toisin kuin muut monikanavaiset surround -muodot, sen lähetyskanavat eivät välitä kaiutinsignaaleja. Sen sijaan ne sisältävät kaiuttimesta riippumattoman esityksen äänikentästä nimeltä B-muoto , joka sitten dekoodataan kuuntelijan kaiutinasetuksiin. Tämän lisävaiheen avulla tuottaja voi ajatella lähteen suuntiin kaiuttimien sijainnin sijaan, ja se tarjoaa kuuntelijalle huomattavan joustavuuden toistossa käytettävien kaiuttimien asettelun ja lukumäärän suhteen.

Ambisonics kehitettiin Yhdistyneessä kuningaskunnassa 1970 -luvulla British National Research Development Corporationin alaisuudessa .

Huolimatta vankasta teknisestä perustastaan ​​ja monista eduista, Ambisonics ei ollut vasta äskettäin ollut kaupallinen menestys ja selviytyi vain kapeista sovelluksista ja tallennusharrastajien keskuudessa.

Tehokkaan digitaalisen signaalinkäsittelyn helppo saatavuus (toisin kuin kalliit ja virhealttiit analogiset piirit, joita oli käytettävä alkuvuosina) ja kotiteatterin surround-äänijärjestelmien menestyksekäs markkinoille tuominen 1990-luvulta lähtien, kiinnostus Ambisonicsiin äänitysinsinöörit, äänisuunnittelijat, säveltäjät, mediayhtiöt, lähetystoiminnan harjoittajat ja tutkijat ovat palanneet ja kasvavat edelleen.

Johdanto

Ambisonics voidaan ymmärtää kolmiulotteisena M/S (mid/side) stereon laajennuksena , joka lisää ylimääräisiä erokanavia korkeuteen ja syvyyteen. Tuloksena olevaa signaalijoukkoa kutsutaan B-muotoksi . Sen komponenttikanavat on merkitty äänenpaineelle (M M/S), etu-miinus-äänenpainegradientille, vasemmalle-miinus-oikealle (S M/S) ja ylös-miinus-alas .

Signaali vastaa ympärisäteilevä mikrofoni, kun taas ovat komponentteja, jotka voidaan poimia kuva kahdeksikon kapseleiden suuntautuneet kolme spatiaalista akselia.

Lähteen panorointi

Yksinkertainen Ambisonic -panneri (tai enkooderi ) ottaa lähdesignaalin ja kaksi parametria, vaaka- ja korkeuskulman . Se sijoittaa lähteen haluttuun kulmaan jakamalla signaalin Ambisonic -komponenttien päälle eri vahvuuksilla:

Koska kanava on suuntaamaton, se saa aina saman vakio -tulosignaalin kulmista riippumatta. Jotta sillä olisi enemmän tai vähemmän sama keskimääräinen energia kuin muilla kanavilla, W vaimentuu noin 3 dB (tarkasti jaettuna kahden neliöjuurella). Termit todella tuottavat kahdeksan mikrofonin napaisia ​​kuvioita (katso kuva oikealla, toinen rivi). Otamme niiden arvon ja ja , ja kerrotaan tulos tulosignaalilla. Tuloksena on, että tulo päätyy kaikkiin komponentteihin täsmälleen yhtä kovaa kuin vastaava mikrofoni olisi vastaanottanut sen.

Virtuaaliset mikrofonit

Morferointi eri virtuaalimikrofonikuvioiden välillä.

B-formaatti komponentit voidaan yhdistää johtaa virtuaalisen mikrofonit tahansa ensimmäisen kertaluokan suuntausominaiskäyrä (suuntaamaton, kardioidi, hyperkardioidi, kuva-of-kahdeksan tai jotain siltä väliltä), joka osoittaa mihin tahansa suuntaan. Useita tällaisia ​​mikrofoneja, joilla on eri parametrit, voidaan johtaa samanaikaisesti, jotta voidaan luoda samanaikaisia ​​stereopareja (kuten Blumlein ) tai surround -ryhmiä .

Kuvio
Kuva kahdeksasta
Hyper- ja Supercardioids
Kardioidi
Leveät kardioidit
Monisuuntainen

Vaakasuora virtuaalinen mikrofoni vaakasuorassa kuviossa on annettu

.

Tämä virtuaalimikrofoni on vapaakenttä normalisoitu , mikä tarkoittaa, että sillä on jatkuva yhden vahvistuksen akselin ääniä varten. Vasemmassa kuvassa on joitain esimerkkejä, jotka on luotu tällä kaavalla.

Virtuaalimikrofoneja voidaan manipuloida jälkituotannossa: halutut äänet voidaan valita, ei-toivotut vaimentaa ja tasapaino suoran ja kaikuisen äänen välillä voidaan hienosäätää sekoituksen aikana.

Dekoodaus

Naiivi yksikaistainen vaihevaiheinen dekooderi neliömäiseen kaiutinasetteluun.

Perus Ambisonic -dekooderi on hyvin samanlainen kuin joukko virtuaalisia mikrofoneja. Täysin säännöllisiin asetteluihin voidaan luoda yksinkertaistettu dekooderi osoittamalla virtuaalinen kardioidimikrofoni jokaisen kaiuttimen suuntaan. Tässä neliö:

Merkit ja komponentit ovat tärkeä osa, loput ovat vahvistustekijöitä. Komponentti hylätään, koska se ei ole mahdollista toistaa korkeudelle vihjeet vain neljä kaiutinta yhdessä tasossa.

Käytännössä todellinen Ambisonic-dekooderi vaatii useita psykoakustisia optimointeja toimiakseen oikein.

Korkeamman asteen Ambisonics

Visuaalinen esitys Ambisonicin B-muodon komponenteista jopa kolmanteen kertaluokkaan asti. Tummat osat edustavat alueita, joilla napaisuus on käänteinen. Huomaa, kuinka kaksi ensimmäistä riviä vastaavat monisuuntaisia ​​ja kahdeksan mikrofonin napaisia ​​kuvioita.

Ensimmäisen asteen Ambisonicsin tilaratkaisu yllä kuvatulla tavalla on melko alhainen. Käytännössä tämä tarkoittaa hieman epäselviä lähteitä, mutta myös suhteellisen pientä käyttökelpoista kuuntelualuetta tai makeaa kohtaa . Resoluutiota voidaan lisätä ja makeaa kohtaa suurentaa lisäämällä B-muotoon valikoivampia suuntaavia komponentteja. Nämä eivät enää vastaa tavanomaisia ​​mikrofonin napaisia ​​kuvioita, vaan näyttävät pikemminkin apilanlehdiltä. Tuloksena olevaa signaalijoukkoa kutsutaan sitten toisen , kolmannen tai yhdessä korkeamman asteen ambisoniksi .

Täyssfääriset järjestelmät edellyttävät tiettyä tilausta varten signaalikomponentteja, ja komponentteja tarvitaan vain vaakasuoraan toistoon.

Korkeamman asteen Ambisonicsille on olemassa useita eri muotoilukäytäntöjä; Katso lisätietoja kohdasta Ambisonic -tiedonsiirtoformaatit .

Vertailu muihin surround -muotoihin

Ambisonics eroaa muista surround -muodoista useissa näkökohdissa:

  • Se on isotrooppinen : ääntä mistä tahansa suunnasta kohdellaan tasavertaisesti sen sijaan, että oletettaisiin, että pääasialliset äänilähteet ovat etupuolella ja että takakanavat ovat vain tunnelmaa tai erikoistehosteita varten.
  • Se vaatii vain kolme kanavaa vaakasuuntaiseen perusääniin ja neljä kanavaa koko pallon äänikenttään. Perus koko pallon toisto vaatii vähintään kuusi kaiutinta (vähintään neljä vaakasuorassa).
  • Ambisonics -signaali on irrotettu toistojärjestelmästä: kaiuttimien sijoittelu on joustavaa (kohtuullisissa rajoissa), ja sama ohjelmamateriaali voidaan dekoodata vaihtelevalle määrälle kaiuttimia. Lisäksi leveyden ja korkeuden yhdistelmää voidaan toistaa vain vaaka-, stereo- tai jopa mono-järjestelmissä menettämättä sisältöä kokonaan (se taitetaan vaakasuoraan tasoon ja etuosan neljännekseen). Näin tuottajat voivat omaksua korkean tuotannon ilman huolta tietojen menetyksestä.
  • Ambisonics voidaan skaalata mihin tahansa haluttuun tilaresoluutioon lisälähetyskanavien ja toistettavien kaiuttimien kustannuksella. Korkeamman asteen materiaali pysyy alaspäin yhteensopivana ja sitä voidaan toistaa pienemmällä tilaresoluutiolla ilman erityistä alasekoitusta.
  • Ambisonicsin ydintekniikka on vapaa patenteista, ja täydellinen työkaluketju tuotantoon ja kuunteluun on saatavana ilmaisena ohjelmistona kaikille tärkeimmille käyttöjärjestelmille .

Haittapuolena Ambisonics on:

  • Altis erittäin epävakaita Phantom lähteet ja pienet "sweet spot" kovaäänisen lisääntymisen takia edelle vaikutus .
  • Altistuu vahvalle värjäytymiselle kampasuodatuksen artefakteista johtuen väliaikaisesti siirtyneistä koherenteista aaltorintamista, kun ne tuotetaan kaiutinryhmien kautta.
  • Laatupainotteiset äänisuunnittelijat eivät hyväksy lukemattomista yrityksistä ja mahdollisista käyttötapauksista 1970-luvun alusta lähtien.
  • Markkinoidaan usein harhaanjohtavilla esityksillä, jotka eivät vastaa käytännön käyttötapauksia, esimerkiksi olettaen tiukasti pallomaisen kanavaryhmän ja kuuntelijan, joka istuu täsmälleen keskellä tai rajoittaa aaltokenttäkaavioita pienelle taajuusalueelle.
  • Mikään suuri levy -yhtiö tai mediayhtiö ei tue sitä. Vaikka useita Ambisonic UHJ -muodossa (UHJ) koodattuja kappaleita (pääasiassa klassisia) voidaan löytää, joskin vaikeuksitta, Spotifyn kaltaisiin palveluihin. [1] .
  • Käsitteellisesti vaikeaa ihmisten ymmärtää, toisin kuin perinteinen "yksi kanava, yksi puhuja" -mallisto.
  • Kuluttajan käyttöönotto on monimutkaisempaa dekoodausvaiheen vuoksi.

Teoreettinen perusta

Äänikenttäanalyysi (koodaus)

B-muodon signaalit käsittävät äänikentän pallomaisen harmonisen hajottamisen. Ne vastaavat äänenpainetta ja painegradientin kolmea osaa (ei pidä sekoittaa niihin liittyvään hiukkasnopeuteen ) jossain avaruuden kohdassa. Yhdessä nämä arvioivat mikrofonin ympärillä olevan pallon äänikentän. muodollisesti moninapaisen laajennuksen ensimmäisen asteen katkaisu . (monosignaali) on nollatasoinen tieto, joka vastaa pallon vakiofunktiota, kun taas ovat ensimmäisen asteen termit (dipolit tai luvut kahdeksasta). Tämä ensimmäisen asteen katkaisu on vain likimääräinen arvio koko äänikentästä.

Korkeampi tilausten vastaavat edelleen ehdot moninapaisen laajentamiseen toiminnon alalla kannalta palloharmonisten. Käytännössä korkeammat tilaukset vaativat enemmän kaiuttimia toistoon, mutta lisäävät tilaresoluutiota ja suurentavat aluetta, jolla äänikenttä toistetaan täydellisesti (ylärajataajuuteen asti).

Tämän alueen säde ambisoniseen järjestykseen ja taajuuteen on annettu

,

missä tarkoittaa äänen nopeutta.

Tästä alueesta tulee pienempi kuin ihmisen pää, joka on yli 600 Hz ensimmäisen asteen tai 1800 Hz kolmannen kertaluvun. Tarkka toisto jopa 20 kHz: n pään kokoisella äänenvoimakkuudella edellyttäisi 32 tai yli 1000 kaiuttimen luokkaa.

Niillä taajuuksilla ja kuuntelupaikoilla, joissa täydellinen äänikentän rekonstruointi ei ole enää mahdollista, Ambisonics -toiston on keskityttävä oikeiden suuntaohjeiden tuottamiseen, jotta hyvä lokalisointi voidaan tehdä myös rekonstruointivirheiden yhteydessä.

Psykoakustiikka

Ihmisen kuulolaite on erittäin tarkasti lokalisoitu vaakasuoralle tasolle (joissakin kokeissa yhtä hieno kuin 2 asteen lähteen erotus). Kaksi vallitsevaa vihjettä eri taajuusalueille voidaan tunnistaa:

Matalataajuinen lokalisointi

Alhaisilla taajuuksilla, joissa aallonpituus on suuri ihmisen päähän verrattuna, saapuva ääni hajautuu sen ympärille, joten akustista varjoa ei käytännössä ole ja korvien välillä ei siis ole eroa. Tällä alueella ainoa saatavilla oleva tieto on kahden korvasignaalin välinen vaihesuhde, jota kutsutaan interaktiiviseksi aikaeroksi tai ITD: ksi . Tämän aikaeron arvioiminen mahdollistaa tarkan lokalisoinnin hämmennyskartion sisällä : tulokulma on yksiselitteinen, mutta ITD on sama edestä tai takaa tuleville äänille. Niin kauan kuin ääni ei ole aiheelle täysin tuntematon, sekaannus voidaan yleensä ratkaista havaitsemalla korvan läpien (tai kärkien ) aiheuttamat etuosan takaosan vaihtelut .

Korkeataajuinen lokalisointi

Kun aallonpituus lähestyy kaksi kertaa pään kokoa, vaihesuhteet muuttuvat epäselviksi, koska ei ole enää selvää, vastaako korvien välinen vaihe -ero yhtä, kahta tai jopa useampaa jaksoa taajuuden kasvaessa. Onneksi pää luo merkittävän akustisen varjon tällä alueella, mikä aiheuttaa pienen eron korvien välillä. Tätä kutsutaan interaktiiviseksi tasoeroksi tai ILD: ksi (sama sekaannuskartio koskee). Yhdessä nämä kaksi mekanismia tarjoavat lokalisoinnin koko kuuloalueella.

ITD- ja ILD -lisääntyminen Ambisonicsissa

Gerzon on osoittanut, että toistettavan äänikentän lokalisointivihjeiden laatu vastaa kahta objektiivista mittaria: ITD: n hiukkasnopeusvektorin pituus ja ILD: n energiavektorin pituus . Gerzon ja Barton (1992) määrittävät vaakasuuntaisen surround -dekooderin Ambisoniciksi, jos

  • vähintään 4 kHz: n suunnat ja samaa mieltä,
  • alle 400 Hz: n taajuuksilla kaikille atsimuuttikulmille ja
  • taajuuksilla noin 700 Hz - 4 kHz, suuruus on "oleellisesti maksimoitu mahdollisimman suurella osalla 360 asteen äänitasoa" .

Käytännössä tyydyttäviä tuloksia saavutetaan kohtuullisilla tilauksilla jopa erittäin suurilla kuuntelualueilla.

Äänikenttäsynteesi (dekoodaus)

Periaatteessa kaiutinsignaalit johdetaan käyttämällä Ambisonic -komponenttisignaalien lineaarista yhdistelmää , jossa jokainen signaali riippuu kaiuttimen todellisesta sijainnista suhteessa kuvitteellisen pallon keskipisteeseen, jonka pinta kulkee kaikkien käytettävissä olevien kaiuttimien läpi. Käytännössä kaiuttimien hieman epäsäännölliset etäisyydet voidaan kompensoida viiveellä .

Todellinen Ambisonics-dekoodaus vaatii kuitenkin signaalien avaruuden tasauksen, jotta voidaan ottaa huomioon korkean ja matalan taajuuden äänen paikantamismekanismien erot ihmisen kuulossa. Edelleen tarkennetaan kuuntelijan etäisyyttä kaiuttimista ( lähikentän kompensointi ).

Yhteensopivuus olemassa olevien jakelukanavien kanssa

Ambisonics -dekoodereita ei tällä hetkellä markkinoida loppukäyttäjille merkittävällä tavalla, eikä alkuperäisiä Ambisonic -tallenteita ole kaupallisesti saatavilla. Siksi Ambisonicsissa tuotettu sisältö on saatettava kuluttajien saataville stereo- tai erilliskanavamuodossa.

Stereot

Ambisonics -sisältö voidaan taittaa automaattisesti stereoksi ilman erillistä sekoitusta. Yksinkertaisin tapa on ottaa näytteitä B-muodosta virtuaalisen stereomikrofonin avulla . Tulos vastaa sattumanvaraista stereotallennetta. Kuvantaminen riippuu mikrofonin geometriasta, mutta yleensä takalähteet toistetaan pehmeämmin ja hajanaisemmin. Vertikaaliset tiedot ( kanavalta) jätetään pois.

Vaihtoehtoisesti B-muoto voidaan matriisikoodata UHJ-muotoon , joka soveltuu suoratoistoon stereojärjestelmissä. Kuten ennenkin, pystysuuntainen informaatio hylätään, mutta vasemman ja oikean toiston lisäksi UHJ yrittää säilyttää osan vaakasuuntaisista surround-tiedoista kääntämällä takana olevat lähteet vaiheen ulkopuolisiksi signaaleiksi. Tämä antaa kuuntelijalle jonkinlaisen tunteen takapaikasta.

Kaksikanavainen UHJ voidaan myös dekoodata takaisin vaakasuoraan Ambisonics-järjestelmään (jossain määrin heikkenee), jos Ambisonic-toistojärjestelmä on käytettävissä. Häviötön UHJ jopa neljä kanavaa (mukaan lukien korkeustiedot) on olemassa, mutta ei ole koskaan nähnyt laajaa käyttöä. Kaikissa UHJ -järjestelmissä kaksi ensimmäistä kanavaa ovat tavanomaisia ​​vasemman ja oikean kaiuttimen syötteitä.

Monikanavaiset muodot

Samoin on mahdollista dekoodata Ambisonics-materiaali mielivaltaisiin kaiutinasetteluihin, kuten Quad , 5.1 , 7.1 , Auro 11.1 tai jopa 22.2 , uudelleen ilman manuaalista väliintuloa. LFE -kanava joko jätetään pois tai erityinen sekoitus luodaan manuaalisesti. Esidekoodaus 5.1-levylle on tunnettu G-formaatista DVD-äänen alkuaikoina, vaikka termi ei ole enää yleisessä käytössä.

Esidekoodauksen ilmeinen etu on, että kuka tahansa surround-kuuntelija voi kokea Ambisonicsin; mitään erityistä laitteistoa ei tarvita tavallisen kotiteatterijärjestelmän lisäksi. Suurin haittapuoli on se, että joustavuus yhden, tavanomaisen Ambisonics -signaalin esittämisessä mihin tahansa kohdekaiutinryhmään menetetään: signaali olettaa tietyn "vakio" -asettelun ja jokainen, joka kuuntelee eri ryhmällä, voi heikentyä lokalisointitarkkuudessa.

Kohdeasettelut 5.1: stä ylöspäin ylittävät yleensä ensimmäisen asteen Ambisonicsin tilaresoluution, ainakin etuneljänneksessä. Optimaalisen resoluution saavuttamiseksi, liiallisen ylikuulumisen välttämiseksi ja kohdeasettelun epäsäännöllisyyksien kiertämiseksi tällaisten kohteiden esidekoodaukset olisi johdettava korkeamman asteen Ambisonics-lähdemateriaalista.

Tuotannon työnkulku

Ambisonista sisältöä voidaan luoda kahdella perustavalla: tallentamalla ääni sopivalla ensimmäisen tai korkeamman asteen mikrofonilla tai ottamalla erilliset monofoniset lähteet ja panoroimalla ne haluttuihin paikkoihin. Sisältöä voidaan myös käsitellä, kun se on B-muodossa.

Ambisoniset mikrofonit

Alkuperäiset B-muotoiset taulukot

Joukon on suunnitellut ja valmistanut tohtori Jonathan Halliday Nimbus Recordsista

Koska ensimmäisen kertaluvun Ambisonics-komponentit vastaavat fyysisiä mikrofonien noutomalleja, on täysin käytännöllistä tallentaa B-muoto suoraan kolmella yhteensopivalla mikrofonilla: suuntaava kapseli, yksi eteenpäin suunnattu kuva-8-kapseli ja yksi vasemmalle päin oleva kuva -8 kapseli, jolloin saatiin , ja komponentteja. Tätä kutsutaan alkuperäiseksi tai Nimbus/Halliday -mikrofoniryhmäksi sen suunnittelijan tohtori Jonathan Hallidayn jälkeen Nimbus Recordsissa , jossa sitä käytetään tallentamaan heidän laaja ja jatkuva Ambisonic -julkaisujen sarja. C700S on integroitu natiivi B-koon mikrofoni, ja sitä on valmistanut ja myynyt Josephson Engineering vuodesta 1990.

Tämän lähestymistavan ensisijainen vaikeus on, että korkeataajuinen paikannus ja selkeys perustuvat kalvoihin, jotka lähestyvät todellista sattumaa. Pinoamalla kapselit pystysuunnassa saadaan aikaan täydellinen sattuma vaakasuorille lähteille. Kuitenkin ylhäältä tai alhaalta tuleva ääni kärsii teoriassa hienovaraisista kampasuodatustehosteista korkeimmilla taajuuksilla. Useimmissa tapauksissa tämä ei ole rajoitus, koska äänilähteet kaukana vaakatasosta ovat tyypillisesti huoneen jälkikaiuntaa. Lisäksi pinottujen kuvion 8 mikrofonielementtien pinoamisakselin suuntaan on syvä nolla niin, että ensisijainen muunnin näissä suunnissa on keskisuuntainen mikrofoni. Käytännössä tämä voi tuottaa vähemmän lokalisointivirheitä kuin jompikumpi vaihtoehdoista (tetraedriset taulukot prosessoinnilla tai neljäs mikrofoni Z -akselille).

Alkuperäisiä matriiseja käytetään yleisimmin vain vaakasuorassa surround-tilassa, koska sijaintivirheet ja varjostustehosteet lisääntyvät, kun neljättä mikrofonia lisätään.

Tetraedrinen mikrofoni

Koska on täysin mahdotonta rakentaa täysin sattumanvaraista mikrofoniryhmää, seuraavaksi paras tapa on minimoida ja jakaa paikannusvirhe mahdollisimman tasaisesti. Tämä voidaan saavuttaa järjestämällä neljä kardioidi- tai alikardioidikapselia tetraedriin ja tasoittamalla tasainen diffuusikenttävaste. Kapselisignaalit muunnetaan sitten B-muotoon matriisitoiminnolla.

Ambisonicsin ulkopuolella tetraedrisistä mikrofoneista on tullut suosittuja stereotekniikalla tai 5.1-tilassa työskentelevien paikantallennusinsinöörien keskuudessa, koska ne ovat joustavia jälkituotannossa; tässä B-muotoa käytetään vain välituotteena virtuaalisten mikrofonien johtamiseen .

Korkeamman tason mikrofonit

Ykkösjärjestyksen yläpuolella ei ole enää mahdollista saada Ambisonic-komponentteja suoraan yksittäisillä mikrofonikapseleilla. Sen sijaan korkeamman asteen erotussignaalit johdetaan useista avaruudessa hajautetuista (yleensä monisuuntaisista) kapseleista käyttäen erittäin hienostunutta digitaalista signaalinkäsittelyä.

Em32 Eigenmike on kaupallisesti saatavilla oleva 32-kanavainen, ambisoninen mikrofoniryhmä.

Peter Cravenin et ai. (Myöhemmin patentoitu) kuvaa kaksisuuntaisten kapseleiden käyttöä korkeamman asteen mikrofoneihin asiaan liittyvän tasauksen ääripäiden vähentämiseksi. Mikään mikrofoni ei ole vielä tehty tätä ajatusta käyttäen.

Ambisoninen panorointi

Yksinkertaisin tapa tuottaa mielivaltaisen korkeatasoisia Ambisonic -sekoituksia on ottaa monofoniset lähteet ja sijoittaa ne Ambisonic -kooderilla.

Täyspallokooderilla on yleensä kaksi parametria, atsimuutti (tai horisontti) ja korkeuskulma. Kooderi jakaa lähdesignaalin Ambisonic -komponentteihin siten, että dekoodattaessa lähde näkyy halutussa paikassa. Kehittyneemmät pannerit tarjoavat lisäksi sädeparametrin, joka huolehtii etäisyydestä riippuvasta vaimennuksesta ja basson tehostamisesta lähikenttävaikutuksen vuoksi.

Laitteiston panorointiyksiköt ja sekoittimet ensimmäisen tilauksen Ambisonicsille ovat olleet saatavilla 1980-luvulta lähtien ja niitä on käytetty kaupallisesti. Nykyään panorointilaajennuksia ja muita niihin liittyviä ohjelmistotyökaluja on saatavana kaikille suurille digitaalisille äänityöasemille, usein ilmaisina ohjelmistoina . Kuitenkin mielivaltaisten väyläleveysrajoitusten vuoksi harvat ammattimaiset digitaaliset äänityöasemat (DAW) tukevat toisia korkeampia tilauksia. Merkittäviä poikkeuksia ovat REAPER , Pyramix , ProTools , Nuendo ja Ardor .

Ambisoninen manipulointi

Ensimmäisen kertaluvun B-muotoa voidaan manipuloida eri tavoilla, jotta voidaan muuttaa kuulokohtauksen sisältöä. Tunnettuja manipulointeja ovat "kierto" ja "dominointi" (lähteiden siirtäminen tiettyyn suuntaan tai poispäin).

Lisäksi lineaarinen aika-invariantti signaalinkäsittely , kuten tasaus, voidaan soveltaa B-muotoon häiritsemättä äänisuuntia, kunhan se koski kaikkia komponenttikanavia tasaisesti.

Viimeaikainen kehitys korkeammassa järjestyksessä Ambisonics mahdollistaa laajan valikoiman manipulointeja, mukaan lukien kierto, heijastus, liike, 3D- kaiku , sekoittaminen vanhoista muodoista, kuten 5.1 tai ensimmäisen kertaluvun, visualisointi ja suunnasta riippuvainen peittäminen ja tasoitus.

Tietojenvaihto

Ambisonic B -formaatin siirtäminen laitteiden välillä ja loppukäyttäjille vaatii standardoidun vaihtomuodon. Vaikka perinteinen ensimmäisen kertaluvun B-muoto on hyvin määritelty ja yleisesti ymmärretty, korkeamman asteen ambisonicsille on ristiriitaisia ​​yleissopimuksia, jotka eroavat toisistaan ​​sekä kanavajärjestyksessä että painotuksessa ja joita on ehkä tuettava jonkin aikaa. Perinteisesti yleisin on FURSE-Malham korkeamman asteen muoto on .ambsäiliö perustuu Microsoftin WAVE-EX-tiedostomuodossa. Se skaalautuu jopa kolmanteen järjestykseen ja sen tiedostokoko on 4 Gt.

Uudet toteutukset ja tuotannot saattavat haluta harkita AmbiX -ehdotusta, joka hyväksyy .caftiedostomuodon ja poistaa 4 Gt: n rajoituksen. Se skaalautuu mielivaltaisesti korkeisiin tilauksiin ja perustuu SN3D -koodaukseen. Google on käyttänyt SN3D -koodausta YouTube 360 ​​-muodonsa perustana.

Nykyinen kehitys

Avoin lähdekoodi

Vuodesta 2018 lähtien ilmainen avoimen lähdekoodin toteutus on olemassa Opus -äänikoodekissa .

Yritysten kiinnostus

Sen jälkeen , kun Ambisonics on hyväksynyt Googlen ja muut valmistajat virtuaalitodellisuuden parhaaksi äänimuodoksi, kiinnostus on kasvanut.

Vuonna 2018 Sennheiser julkaisi VR -mikrofonin ja Zoom julkaisi Ambisonics Field Recorderin. Molemmat ovat toteutuksia tetraedrisestä mikrofonista, joka tuottaa ensimmäisen asteen Ambisonicsin.

Useat yritykset tekevät parhaillaan Ambisonics -tutkimusta:

Dolby Laboratories on ilmaissut "kiinnostuksensa" Ambisonicsia kohtaan hankkimalla (ja likvidoimalla) Barcelonan Ambisonics-asiantuntija-imm- äänen ennen Dolby Atmosin lanseerausta , joka, vaikka sen tarkat toiminnot ovat julkistamattomia, toteuttaa eron lähteen suunnan ja kaiuttimien todellisten sijaintien välillä. Atmos lähestyy täysin eri tavalla, koska se ei yritä lähettää äänikenttää; se lähettää erillisiä esiseoksia tai varret (eli raaka äänidata) ja metatietoja siitä, mistä paikasta ja suunnasta niiden pitäisi näyttää tulevan. Varret dekoodataan, sekoitetaan ja renderöidään reaaliajassa käyttämällä mitä tahansa kaiuttimia, jotka ovat käytettävissä toistopaikassa.

Käytä pelaamiseen

Korkeamman asteen Ambisonics on löytänyt markkinaraon Codemastersin kehittämille videopeleille . Heidän ensimmäinen peli, jossa käytettiin Ambisonic -äänimoottoria, oli Colin McRae: DiRT , mutta tämä käytti vain Ambisonicsia PlayStation 3 -alustalla. Heidän pelinsä Race Driver: GRID laajensi Ambisonicsin käytön Xbox 360 -alustalle, ja Colin McRae: DiRT 2 käyttää Ambisonicsia kaikilla alustoilla, myös PC: llä.

Äskettäinen pelejä Codemasters, F1 2010 , Dirt 3 , F1 2011 ja Dirt: Showdown , käytä neljännen asteen Ambisonics nopeammilla tietokoneet, suorittamista Blue Ripple Sound n Rapture3D OpenAL kuljettajan ja Esisekoitetun Ambisonic ääntä tuotetaan käyttämällä Bruce Wiggins "WigWare Ambisonic-laajennukset.

OpenAL Soft [2] , OpenAL -määrityksen ilmainen ja avoimen lähdekoodin toteutus, käyttää myös Ambisonicsia 3D -äänen toistamiseen. OpenAL Softia voidaan usein käyttää muiden OpenAL-toteutusten pudotuspisteenä, jolloin useat OpenAL-sovellusliittymää käyttävät pelit voivat hyötyä äänen toistamisesta Ambisonicsin avulla.

Useissa peleissä, jotka eivät hyödyntää OpenAL API natiivisti, käyttö kääreen tai ketjun kääreitä voivat auttaa tekemään näitä pelejä epäsuorasti käyttää OpenAL API. Viime kädessä tämä johtaa siihen, että ääni toistetaan Ambisonicsissa, jos käytetään kykenevää OpenAL -ohjainta, kuten OpenAL Soft.


Patentit ja tavaramerkit

Suurin osa Ambisonic -kehitykseen liittyvistä patenteista (mukaan lukien Soundfield -mikrofonin kattavat patentit ) on nyt vanhentunut , ja sen seurauksena perustekniikka on kaikkien saatavilla. Poikkeuksia tähän ovat tri Geoffrey Bartonin Trifield- tekniikka, joka on Ambisonic-teoriaan ( US 5594800  ) perustuva kolmen kaiuttimen stereojärjestelmä , ja ns. "Wien" -dekooderit, jotka perustuvat Gerzonin ja Bartonin Wienin AES-paperiin 1992, jotka on tarkoitettu dekoodaukseen epäsäännöllisiin kaiutinjärjestelmiin ( US 5757927  ).

Patenttien "poolin", joka käsittää Ambisonics -tekniikan, koosi alun perin Yhdistyneen kuningaskunnan hallituksen National Research & Development Corporation (NRDC), joka oli olemassa 1970 -luvun loppuun asti kehittääkseen ja edistääkseen brittiläisiä keksintöjä ja lisensoimalla ne kaupallisille valmistajille - mieluiten yhdelle lisenssinsaajalle. Järjestelmä sai lopulta lisenssin Nimbus Recordsille (jonka omistaa nyt Wyastone Estate Ltd).

"Lukittavat ympyrät" Ambisonic -logo (Ison -Britannian tavaramerkit UK00001113276 ja UK00001113277 ) ja tekstimerkit "AMBISONIC" ja "AMBISO N" (Yhdistyneen kuningaskunnan tavaramerkit UK00001500177 ja UK00001112259 ), jotka ovat aiemmin omistaneet Wyastone Estate Ltd., ovat vanhentuneet vuodesta 2010.

Katso myös

Huomautuksia

Viitteet

Ulkoiset linkit