Voice over filformat handlar om vilken ljudfil du får (t.ex. WAV eller MP3), i vilken teknisk kvalitet (samplerate/bitdjup) och hur versioner/filer är uppmärkta så att de går att lägga in i din produktion utan gissningar.

Det viktigaste i korthet

  • Be om WAV för allt som ska in i mix/klipp. MP3 duger bara för snabb lyssning.
  • Matcha alltid projektets samplerate/bitdjup (oftast 48 kHz/24-bit för video). Annars får du onödiga konverteringar och ibland drift/problem.
  • Bestäm filnamn och versioner innan inspelning: “final”, “alt”, “clean”, “timed”, “pickup” ska betyda samma sak för alla.

Filformat: vad du faktiskt ska be om

Om du ska klippa, synka eller mixa ska du i praktiken alltid be om WAV. Det är okomprimerat och klarar efterbearbetning utan att du bygger in artefakter från början.

MP3 kan vara okej som referens (för att godkänna tagning eller text), men jag hade inte byggt en leverans eller en mixkedja på MP3 om det går att undvika. Det blir snabbt en felsökningsgrej: “är det rummet, rösten eller komprimeringen?”.

Så här brukar jag skriva i beställningen när jag vill undvika onödigt fram och tillbaka:

  • Master: WAV (mono), 48 kHz, 24-bit
  • Referens: MP3, 320 kbps (valfritt)

Mono är normalt rätt för voice over. Stereo blir mest större filer och fler möjligheter att något hamnar snett i kedjan. Undantag finns (t.ex. om ni uttryckligen vill ha en stereofil med rum/effekt), men standard är mono.

Nivåer: så du slipper klippa sönder din mix

Nivåer är där många produktioner får onödiga problem. Antingen kommer filen in för stark (klipper) eller så är den så låg att någon drar upp 20 dB och råkar få med brus och rum.

Det du vill ha är en fil som är inspelad med bra headroom och som inte är “hårdnormad” för att låta hög. I praktiken:

  • Ingen clipping. Inte “bara lite”.
  • Jämn nivå, men inte sönderkomprimerad.
  • Headroom så att du kan mixa mot musik/ljud utan att allt redan sitter mot taket.

Om du måste sätta en siffra: be om peaks runt -6 dBFS och en rimlig loudness för tal (inte maxat). Det viktiga är inte exakt LUFS i rå-VO, utan att materialet är rent och användbart.

Ett återkommande projektproblem är att någon levererar “färdig radio”-talnivå, och så ska det in i en film där ni behöver dynamik och plats för musik. Då får ni backa ur det som redan är gjort. Därför: be hellre om en ren leverans (och om ni behöver en “broadcast”-variant, be om en extra version).

Versioner: vad “final” betyder när det blir stressigt

Versioner är inte teknik. Det är logistik. Det som brukar hända i produktion är att ni har tre manusversioner, två olika uttal på ett produktnamn och en kund som godkänner något i ett mejl som ingen annan ser.

För att undvika det behöver ni en enkel standard för vad som levereras:

  • Clean: redigerad VO utan musik/SFX (det ni vill ha 9 av 10 gånger)
  • Timed: samma VO men tidsanpassad mot bild/längd om ni behöver exakt timing
  • Alt: alternativ läsning (annan betoning/tempo) som separat fil
  • Pickup: kompletteringsinspelningar, tydligt märkta per rad/tidskod

När någon säger “kan du bara skicka finalen?” är det ofta oklart om de menar “senaste inspelningen” eller “den version som är godkänd”. Jag rekommenderar att ni reserverar ordet final till “godkänd för publicering”, och använder v01, v02… för arbetsversioner.

Filnamn och struktur: tråkigt, men det sparar timmar

Det här är en av de mest konkreta tidsbesparingarna jag ser i verkliga projekt: tydliga filnamn och en mappstruktur som stämmer med er klipp/mix.

En enkel standard som funkar i de flesta team:

  • Projekt_Kund_Språk_Manusv_VO_namn_Typ_Version.wav
  • Exempel: ACME_Film_SE_Mv3_AnnaKarlsson_Clean_v02.wav

Om ni jobbar med många korta assets (t.ex. e-learning, IVR, annonser) är det ofta bättre att leverera per rad/ID:

  • ACME_IVR_SE_L001_v01.wav
  • ACME_IVR_SE_L002_v01.wav

Poängen är att teknik och produktion ska kunna se direkt vad filen är, utan att öppna den. Det minskar felanvändning, särskilt när deadlines är tajta.

Process / checklista

  • Bestäm först: var ska VO:n användas (film, webb, radio, telefon, e-learning)? Det styr 48/44.1 kHz och hur tajt timing behöver vara.
  • Skriv i beställningen: “Leverans: WAV mono, 48 kHz/24-bit, clean + ev timed/alt.”
  • Kom överens om versionslogik: v01/v02 för arbetsversioner, “final” endast när godkänd.
  • Bestäm filnamn innan inspelning och håll det konsekvent. Lägg gärna med manusv i filnamnet.
  • Be om både clean och en MP3-referens om ni vill kunna snabblyssna utan att ladda tunga filer.
  • Kontrollera vid leverans: filformat, samplerate, mono/stereo, att inget klipper, och att filnamnen matchar manus/shotlist.

Nästa steg

Om du vill slippa tekniska överraskningar: skicka din spec innan inspelning (format, samplerate, mono/stereo, versioner och filnamn). Om du är osäker på vad som passar din kedja, skicka vad du klipper/mixar i (t.ex. “Premiere 48k”) så går det att låsa leveransen direkt. Kontaktväg finns här: kontakt. Vill du veta hur jag brukar jobba i praktiken med leveranser och versioner: om.

FAQ

Kan ni leverera i MP3 istället för WAV?

Ja, men säg till om MP3 är tänkt som slutformat eller bara för lyssning. För klipp/mix: ta WAV. För snabbgodkännande: MP3 funkar.

Vi har fått filer som inte går att importera eller som låter “konstigt”. Vad beror det oftast på?

Vanligast är fel samplerate (44.1 i ett 48-projekt), fel kanalformat (stereo när ni förväntar mono), eller att filen är konverterad flera gånger. Skriv 48 kHz/24-bit mono i spec och håll er till WAV så minskar det nästan alltid.

Ska jag be om 44.1 kHz eller 48 kHz?

Video/film: nästan alltid 48 kHz. Musikrelease: ofta 44.1 kHz. Matcha det projektet är satt till från början.

Vad är skillnaden på “clean” och “raw”?

Raw är i princip orörd inspelning. Clean är redigerad (pauser, klick, andningar vid behov) men utan musik/SFX. För produktion är clean vanligtvis det ni vill ha.

Hur hanterar ni pickups så att vi inte råkar lägga in fel rad?

Pickup-filer märks per rad/ID eller med tydlig notering i filnamn, och levereras separerat från huvudfilen. Då kan ni lägga dem på rätt plats utan att leta i en lång fil.


Läs mer: