آیا MPEG-4 آخرین تکنولوژى چندرسانهاى است که همگان انتظار آنرا مىکشیدند؟ بیایید با هم نگاهى به آن بیندازیم تا بفهمیم این تکنولوژى چگونه روش اجرا و انتقال فایلهاى چندرسانهاى را تحول بخشیده است؟
Multimedia (چندرسانهاى)؛ کلمهاى که اولین بار پس از ظهور کلیپهاى ویدئویى کوتاه روى کامپیوترها بر سرزبانها رواج یافت. آن روزها این کلمه خیلى عجیب مىنمود اما امروزه کلمه و عبارتى بسیار معمول شده است.
تمام امکانات چندرسانهاى PC شما تنها صوت و ویدئو نیست؛ اما استفاده از تمام پتانسیل چندرسانهاى کامپیوترها فعلاً کمى دور از واقعیت است. DVD کامپیوتر را تبدیل به یک دستگاه خانگى براى اجراى ویدیو کرد، اما هنوز توانایى فرستادن فایلهاى چندرسانهاى (که اغلب هم حجیم هستند) از طریق شبکهها روى PCها و دستگاههایى مانند تلفنهاى همراه کمى با مشکل مواجه است.
تکنولوژى جدیدى که قول داده اجرا و انتقال چندرسانهاىها را روى شبکه متحول گرداند، با نام MPEG-4 شناخته مىشود. شاید این تکنولوژى قالب کلى چندرسانهاى را براى دستگاهها و برنامههاى کاربردى خاصى بهبود بخشد.
گروه متخصصین تصاویر متحرک (MPEG یا Moving Picture Experts Group) کمیتهاى است که استانداردهاى محتویات چندرسانهاىها را تعریف و تعیین مىکند. این کمیته از صدها محقق و مهندس از سرتاسر دنیا تشکیل شده است. MPEG استانداردهاى صوتى و تصویرى MPEG-1 و MPEG-2 را که نقشى اساسى در پیشرفت چندرسانهاى خصوصاً براى PCها بازى مىکرد را تعریف کرده و توسعه داد. آخرین دستاورد این گروه با نام MPEG-4 دریچهاى رویایى به روى کاربران تکنولوژىهاى قبلى این گروه گشود.
MPEG-4 ابتدا به عنوان یک استاندارد بینالمللى (با نام رسمى ISO/IEC 69441) در اکتبر 1998 تصویب شد. MPEG چند تابع و عملکرد جدید به این تکنولوژى اضافه کرد و دومین نسخه MPEG-4 را که رسماً در دسامبر 1999 معرفى شد، بوجود آورد. نسخه دوم کاملاً با نسخه اول خود سازگار است.
استانداردهاى MPEG نباید به عنوان یک موفقیت در بهبود تکنولوژیها دیده شود؛ هرکدام از این استانداردها هدفى را برآورده مىکنند که براى آن طراحى شدهاند، نه بیشتر و نه کمتر.
MPEG-1 بوجود آمد تا ویدئوهاى با کیفیت VHS را روى پهناى باندى به اندازه 150 کیلوبایت در ثانیه (سرعتى برابر با یک درایو 1X CD) که در آن زمان سرعت معمول بود، پخش کند. MPEG-2 تکنولوژى مشابهى است که براى پهناى باندهاى بالاتر بوجود آمد. هدف اصلى این تکنولوژى برنامههاى دیجیتال تلویزیونى و همچنین DVDها بود. MPEG-2 کیفیت تصویرى بهترى نسبت به MPEG-1 دارد چون از پهناى باند بیشترى استفاده مىکند.
فرمت صوتى MP3 که بسیار هم محبوب است، قسمتى از MPEG-1 Audio مىباشد که نام آن از ، MPEG-1 Audio Layer3 برداشته شده و از الگوریتمهاى فرانهوفر استفاده مىکند. MPEG-3 هم هرگز وجود نداشته، بلکه نام گذارى از MPEG-2 به MPEG-4 جهش داشته است.
تمام استانداردهاى MPEG به فشردهسازى اطلاعات ویدئویى و صوتى دیجیتال کمک مىکنند، پس مىشود به طور مؤثرى از این استانداردها بهره برد. MPEG-4 هم همین کار را انجام مىدهد، اما قدرت فشردهسازى آن بسیار بیشتر از استانداردهاى قبلى است. اما MPEG-4 یک جهش کوانتومى به سمتى است که با اشیاء موجود در تصاویر با یک حس واحد برخورد نشود. به عبارت دیگر MPEG-4 همانند زبان برنامهنویسى C++، شىءگرا (Object Oriented) است. تصویرى که بیننده آنرا به شکل یک کلیت واحد مىبیند مىتواند به صورت چندین جزء مشخص و جداگانه درنظر گرفته شود که به طور یکپارچه در کنار هم جمع شدهاند. این خصیصه پهناى باند کمترى اشغال مىکند و MPEG-4 را هم برخلاف تکنولوژیهاى قبلى، Interactive مىسازد.
طراحى کاملاً متفاوت شىءگرا:
استانداردهاى قبلى MPEG طبق ایدهاى پایهگذارى شد که در آن ایده فایلهاى صوتى و تصویرى کلاسیک (یک پنجره مستطیلى از ویدئو که با صوت یا Soundtrack همراه بود) به یک فرم دیجیتال تبدیل شوند که حجم آن بقدر کافى کم بوده و با توجه به تکنولوژیهاى روز، تصویر و صوت از وضوح قابل قبولى برخوردار باشند. برداشت MPEG-4 از مفهوم شىء (Object) به یک فایل چند رسانهاى اجازه مىدهد که به قطعات کوچکتر و سادهترى به نام «ویدئو» و «صوت» شکانده شوند، بنابراین مىتوان این قطعات را براى ساختن صحنههاى جدید به کارگرفت. بخشهاى مختلف صوت و ویدئو مىتوانند با Objectهاى مستقل درگیر شده و تداخل کنند.
دیگر اینکه MPEG-4 تعریف اشیاء را فراتر از صداها و ویدئوهاى ساده و مسطح مىبرد. اشیاء مىتوانند به صورت Textureهاى شما در برنامههاى سه بعدى، Render شوند. چهرههاى ترکیبى (Synthetic)مىتوانند به صورت Animation درآمده و توسط یک برنامه Text-to-speach (مثل MS-Talk It) صداگذارى شوند. صداها را مىتوان به جاى اجراى دوباره، Synthesize (ترکیب) کرد. MPEG-4 هرکدام از اینها را به عنوان یک شىء درنظر مىگیرد که مىتوان آنها را دستکارى (Manipulate) کرد و مستقل از یکدیگر در صحنههاى فیلمها قرارداد.
جریانهاى رودخانهاى:
MPEG-4 طراحى شده است تا محتویات صوتى و تصویرى به صورت مستمر (درست مثل جریان آب یک رودخانه) اجرا و پخش شوند. با افزایش پهناى باند موجود براى استفاده، بازار رسانههاى مستمر (Streaming) نیز گسترش یافته است. MPEG-4 براى مستمرسازى روى اینترنت، پخش توسط شبکههاى تلویزیونى دیجیتال، انتقالات بىسیم و یا حتى خواندن از روى یک CD بسیار مناسب است. این استاندارد مستقل از روش انتقال (Delivery Method) مىباشد.
ساختار داخلى MPEG-4 رامىتوان به صورت رشتههاى مستمر مختلف درنظر گرفت که براى انتقال با هم ترکیب (Multiplex) شده و روى دستگاه سرویس گیرنده یا Client (که مىتواند یک PC یا یک تلفن همراه باشد)، Demultiplex مىشوند تا رشتههاى مشخص بتوانند به صورت یک فایل چندرسانهاى به هم بچسبند. بلوک اصلى ساختمان رشتههاى ES (Elementary Stream) ، MPEG-4 مىباشد. یک ES ممکن است تراک صوتى یک فیلم باشد. ES در یک OD (یا Object Descripter) بسته مىشود؛ یک ES واحد در یک OD اساسىترین «شىء» در طراحى شىءگراى MPEG-4 مىباشد.
ممکن است شیئى که توسط OD تعریف مىشود شامل بیش از یک ES باشد. براى مثال شىء "Soundtrack" مىتواند شامل چندین رشته صوتى به زبانهاى مختلف باشد. زبان مناسب مىتواند توسط شخص Client انتخاب شود.
MPEG تصور مىکرد MPEG-4 راهى است که باعث توزیع آسان محتویات چندرسانهاى روى دستگاههاى Client با قابلیتهاى مختلف شود. یک کامپیوتر متصل به اینترنت با یک Modem کابلى و یک تلفن همراه که از طریق یک Modem بى سیم Dial-up (شمارهگیرى) مىکند، از نظر قدرت پردازش و پهناى باندى که در اختیار آنها است تفاوتهاى کاملاً محسوسى دارند. MPEG-4 به سازندگان چندرسانهاىها اجازه مىدهد یک موجودیت (Entity) چندرسانهاى مفرد بسازند که هر دو دستگاه بتوانند به آن دسترسى داشته باشند.
یک روش که توسط آن به این مهم دست مىیابیم، طراحى رشتههاى مستمر مىباشد. براى مثال یک OD ممکن است شامل چندین نسخه از یک کلیپ ویدئویى باشد که تحت Bit Rateهاى مختلف ضبط شدهاند. هنگامى یک Client ویدئو را درخواست مىکند، OD اطلاعاتى درباره امکاناتش تهیه مىکند تا بتواند رشته ویدئویى را به صورت مستمر در دسترس قرار دهد. قابل توجهتر اینکه MPEG-4 مىتواند به طور پویا رشتهها را تغییر اندازه دهد (Scale کند) تا تحت شرایطى بتواند این استمرار را اداره کند.
ویدئوى MPEG-4:
اولین تجربه اکثر کاربران با MPEG-4، استفاده از قابلیتهاى ویدئویى این استاندارد مىباشد. اساسىترین Coding فیلم ویدئویى توسط MPEG-4 (که بر پایه DCT بنا گذاشته شده است) انجام مىشود ( DCT در استانداردهاى قدیمى MPEG به کار گرفته مىشد). Compressor فریمهاى متوالى ویدئو را فشرده کرده و سعى در حذف اطلاعات زاید دارد.
در انواع قدیمى فشردهسازى چندرسانهاىها، فریم اصلىترین واحد فشردهسازى ویدئو بود. MPEG-1 و MPEG-2 با حذف اطلاعات اضافى درون یک فریم و اطلاعات زاید بین فریمها، عمل فشردهسازى را انجام مىدهند. براى مثال هنگامى که «خلاصه اخبار» تلویزیون ضبط مىشود، این ویدئو یک پسزمینه تقریباً ثابت و تغییرناپذیر دارد. این پسزمینه از فریمى به فریم دیگر تغییر آنچنانى نخواهد داشت، بنابراین Compressor/Decompressor) CODEC، نرمافزار یا سختافزارى که دادهها را فشرده یا غیرفشرده مىکند) تنها تفاوت بین فریمها را ذخیره مىکند. پسزمینه ثابت هم اطلاعات نسبتاً کمى براى ذخیره دارد. نواحى با رنگ و روشنایى یکسان در یک فریم هم مىتوانند مانند JPEG(تصاویرى که هنوز روى وب به کار گرفته مىشوند) فشرده شوند. هرچند این تکنیکها ویدئو را به طور اساسى فشرده مىکنند، اما اغلب بلوکهایى حجیم هم بوجود مىآورند (خصوصاً وقتى که نواحى با رنگ یکسان پشت سرهم تکرار شوند). این مشکلات روى پهناى باندهاى پایین تشدید مىشوند.
فشردهسازى مبتنى بر فریمها به طور ضمنى سعى مىکند بین پسزمینه ثابت و پیشزمینه متحرک تفاوت قائل شود. MPEG-4 هم مىتواند این کار را انجام دهد، به شما این امکان را هم مىدهد که اجزاء ویدئو را به طور صریح (و نه ضمنى) از یکدیگر جدا کنید. MPEG-4 مىتواند پسزمینه ثابت و پیش زمینه را به عنوان اشیاء جداگانهاى درنظر بگیرد که توسط دستگاه Client به طور یکپارچه با یکدیگر Merge (ترکیب) مىشوند. در مثال «خلاصه اخبار تلویزیونى» شما قسمت کوچکى از کل تصویر کاملاً متحرک است، در نتیجه پهناى باند لازم کاهش مىیابد. پسزمینه ثابت مىتواند تنها در هنگام نیاز Update شود (مثلاً پس از نمایش نقشه هواشناسى، تصاویر اخبار پخش شود) و مىتوان آنرا واضحتر نشان داد چون پس زمینه به جاى اینکه در جریان فیلم حرکت کند مىتواند به طور جداگانه کنترل و Handle شود و به همین طریق نیز در الگوریتم فشردهسازى به کار گرفته شود.
ویدئوى MPEG-4 برخلاف پیشینیانش چیزى فراتر از Coding فیلم ویدئویى شما است. البته محتویات مرکب ویدئو (مثل یک اتومبیل طراحى شده با کامپیوتر) را مىتوان توسط MPEG-1 و MPEG-2 هم فشرده کرد و یا به صورت فایل درآورد اما در این حالت ویدئوى شما ابتدا Render مىشود و سپس شبیه انواع دیگر ویدئو به صورت ترتیبى از فریمها تبدیل مىشود. MPEG-4 عمل Render کردن را توسط Decoder انجام مىدهد.
به طور مثال، در فیلم «اخبار» (یک شىء ویدئویى طبیعى)، گوینده مىتواند پشت یک میز طراحى شده توسط کامپیوتر بنشیند. پارامترهاى این میز به صورت رشتههاى MPEG-4 هستند و دیکودر این رشتهها را کنار یکدیگر مىچیند و شکل «میز» را تولید مىکند. پارامترهاى میز مىتواند شامل Texture آن باشد (فرض کنید میز یک نماى چوب گردویى دارد) تا تصویر واقعیتر به نظر بیاید. این اعمال درست شبیه روندى است که محیطهاى 3D براى خلق بازیهاى ویدئویى از آن استفاده مىکنند: یک Texture (مثل چادر سفید یک شبح) روى مدلى از شبح نگاشت (Map) مىشود. MPEG-4 از اشیاء مرکب 2D و 3D پشتیبانى کرده و مىتواند روى هر دو Texture بپوشاند. همچنین مىتواند اشیاء را متحرک (Antimate) کند. براى متحرک سازى یک مدل لازم است دادههاى خیلى کمى تبادل شوند، پس این نوع متحرک سازى بسیار مناسب براى اتصالات شبکهاى با سرعت پایین است.
MPEG-4 کمکهاى شایانى براى دو مورد بسیار ویژه از مدلهاى مرکب درنظر گرفته است: صورت و بدن انسان. MPEG-4 یک مدل کلى از صورت را در خود دارد که سازندگان ویدئو کافى است براى صحبت کردن و حرکت این صورت آنرا کمى دستکارى کرده و حتى یک Texture به آن اختصاص دهند. صورت همانند یک شىء سه بعدى کلى به دادههاى خیلى کمى براى متحرک شدن نیاز دارد. این دادهها مىتوانند لبها را طورى حرکت دهند که اگر با یک مکالمه Sync شود، درست همانند صورت کسى است که صحبت مىکند. متحرک سازى بدن هم همین گونه است. مىتوانید فرم کلى بدن را به دلخواه تغییر دهید و حرکتهاى بدن را توسط یک رشته بیتى کنترل کنید.
کاربرد اشیاء سهبعدى و پیشبینى شرایط Interaction (عمل متقابل ویدئو) با کاربر (که هر دو نمونههایى از VRML هستند) به MPEG-4 اجازه مىدهند که محیطهاى سهبعدى قابل هدایت ایجاد کنند. در یک صحنه 3D، زاویه دید کاربر هم یک شىء است. بسته به اینکه صحنه چگونه ساخته شده، ممکن است کاربر قادر باشد زاویه دید را تغییر دهد (مثل دور صحنه «پرواز کند») یا زاویه دید را از بین چند زاویه انتخاب کند. یک خریدار Online مىتواند در یک فروشگاه مجازى که پر از مدلهاى سهبعدى از اجناس است به دنبال ملزومات خود بگردد و توسط یک راهنماى انیمیشن اجناس خریدارى شده را در سبد خرید خود بگذارد (این سبد خرید هم مجازى است).
هدف MPEG-4 از ایجاد یک رشته واحد دادهاى قابل دسترس توسط دستگاههاى مختلف، وقتى رویایى مىشود که با ویدئو همراه شود؛ مسلماً ویدئو رسانهاى است که هم به پهناى باند و هم به پردازش بیشترى نیاز دارد. تکنیکهاى استانداردى که ویدئو را در پهناى باند از محدوده زیر 64 کیلوبیت بر ثانیه تا 10مگابیت بر ثانیه پخش مىکنند، پدیدههایى رو به پیشرفت هستند. چندین استراتژى در خدمت این کار هستند که رشتههاى ویدئویى را Scale (کوچک و بزرگ) کنند تا مناسب با پهناى باند و قدرت پردازش باشد.
MPEG-4 مانند اکثر تکنولوژیهاى فشردهسازى ویدئو مىتواند به طور پویا وضوح تصویر را Scale کرده و در هر ثانیه تعداد کمترى فریم براى پهناى باندهاى کوچکتر بفرستد، در نتیجه ویدئو با Soundtrack خود هماهنگ (Synchronized) مىماند. همچنین مىتواند به طور دینامیک وضوح فاصلهاى (Spatial) را هم Scale کند تا MPEG-4 بتواند در هنگام کار با اشیاء مرکب Textureها را براى Decoderهاى ضعیف و یا پهناى باند محدود، فعال یا غیرفعال کند. سازندگان Game با این استراتژى آشنا هستند، چون در اکثر Gameهاى 3D کاربر مىتواند درجه وضوح Texture را تغییر دهد تا بین کیفیت تصویر و سرعت فریمها تناسب ایجاد شود.
گوش کنید: صداى MPEG-4 مىآید
صوت و ویدئو همیشه همراه یکدیگر هستند، و طبعاً MPEG-4 هم ابزارهایى براى کار با صوت درنظر گرفته است. صداى طبیعى با کیفیت بالا توسط ابزار General Audio Coding کنترل مىشود که این ابزار هم از یکى از تکنولوژیهاى MPEG-2 به نام Advenced Audio Coding(یا AAC) مشتق شده است. صداهاى پنج کاناله که ممکن است با یک ویدئوى حجیم همراه باشد باید توسط AAC کد شود. MPEG-4 این توانایى را دارد که به طور پویا کیفیت صدا را کاهش یا افزایش دهد تا کاربر بتواند بر مشکلاتى نظیر پهناى باند پایین و محدودیت Decoder غلبه کند. صوت با استفاده از تکنیکى به نام Bit-Sliced Arithmatic Coding (BSAC) مىتواند Encode شود تا Bit Rate را به اندازه یک کیلوبیت بر ثانیه برساند. این تکنیک جهت تنظیمات دقیق رشتههاى صوتى براى به کارگیرى دینامیک همه منابع سیستمى در دسترس بسیار مناسب است. MPEG-4 تکنولوژیهاى بهینه مخصوصى جهت Coding صداهاى انسانى با Bit Rate کم دارد.
تکنیک Harmonic Vector eXcitation Coding (HVXC) طراحى شده تا کار در محدوده 2 تا 4 کیلوبیت برثانیه را راحتتر کند و حتى مىتواند با سرعت متوسط 2/1 کیلوبیت بر ثانیه کار کند (البته به شرطى که بتوان Bit Rate را تغییرداد). این Bit Rateهاى پایین بسیار مناسب شرایطى مثل پهناى باندهاى بسیار محدود مثل اتصالات ماهوارهاى مىباشد. یک تکنیک دیگر Coding به نام Code Excited Linear Prediction (CELP) جهت Bit Rate هاى 4 تا 24 کیلوبیت بر ثانیه بوجود آمده و براى اتصالات شبکهاى سیار فعلى بسیار مناسب است. انتقال BitRateهاى خیلى پایین صوتى (200 بیت تا 2/1 کیلوبیت در ثانیه) کار با ماجولهاى TTS (Text-to-Speech) را ممکن مىسازد. MPEG-4 ماجول TTS خاصى را مشخص نمىکند، اما رابط TTS (یا TTSI) را در اختیار مىگذارد. ماجول TTS براى سازگارى با TTSI باید به نوعى تطبیق داده شود. اطلاعات درباره جنس، سن و الگوهاى گفتارى شخص سخنگو به TSSI فرستاده مىشود تا یک فایل صوتى خاص از یک شخص بوجود بیاید. تکنولوژى TTS که با مدل ظاهرى MPEG-4 تلاقى یافته، مىتواند صداى صحبتها را در یک جریان دادهاى بسیار کوچک نگهدارى کند.
همانطور که MPEG-4 اجازه خلق اشیاء مرکب ویدئویى را به شما مىدهد، شما هم مىتوانید همین کار را باصداهاى مرکب انجام دهید. ابزار Structured Audio به شما اجازه مىدهد "Instrument"ها را با یک Score کنترل کنید ( Instrument به ویژگیهاى صداهاى Download شده مىگویند نه صداهایى که از قبل روى دستگاه بودهاند. در واقع این صداها به صورت رشتههاى صوتى دریافت شده و سپس Mergeمىشوند). با این ابزار مىتوان صداهاى موسیقایى پرحجم را با پهناى باند کم انتقال داد.
مىدانیم MPEG-4 روى فضاى سهبعدى تأکید دارد، پس جزئیات استانداردى هم وجود دارند که مشخص مىکنند صدا را چگونه مىتوان در یک فضا قرارداد. اندازه، شکل و ویژگیهاى آکوستیکى فضا و محل قرارگیرى منبع صوتى در این فضا مىتواند یک صداى آکوستیک سه بعدى بوجود آورد.
همه را با هم امتحان کنید:
MPEG-4 انواع مختلف تکنولوژیها را براى اشیاء تعریف کرده است. مثلاً Binary Format for Scenes(BIFS) زبانى است که براى تشریح چگونگى نسبت بین صحنه و اشیاء به کار مىرود. BIFS نسخه باینرى فرمت متنى است که توسط Virtual Reality Modeling Language (VRML) به کار مىرود. VRML براى خلق محیطهاى 3D استفاده مىشود که در این محیطها مىتوان توسط یک مرورگر وب جابه جا شد. اما MPEG-4 برخلاف VRML مىتواند همینطور که اطلاعات مىرسند،صحنه را Render کند (به جاى اینکه قبل از شروع Render ابتدا همه اطلاعات را به طور کامل Download کند که این کار سرعت کار را بسیار پایین مىآورد).
اشیاء گروههاى BIFS در یک وراثت، متکى بر نسبت بین صحنه و اشیاء هستند. براى نمونه، صداى گوینده اخبار و تصویر ویدئویى باید با هم در یک گروه باشند و به طور مناسب جلوى صحنه هواشناسى قرار بگیرند. صحنه Static نیست؛ ممکن است در همین حین که دستورات BIFS از طرف Server مىرسند، صدا و تصویر گوینده اخبار در صفحه جابه جا شوند.
امکانات جذاب:
ویدئو، صوت و Interaction در قلب استاندارد MPEG-4 هستند. اداره چنین پیچیدگى روى Decoder مىتواند کار سختى باشد. MPEG-4 یک سیستم برنامهنویسى مبتنى بر Java به نام MPEG-j تعبیه کرده تا Media Playerهاى MPEG-4 را منعطفتر کند. یک برنامه MPEG-jمانند رشته (Stream) هاى مستمر به Decoder فرستاده مىشود. پس از این انتقال، مىتوان برنامه را براى دستکارى عناصر صحنه و یا بهینهکردن Interactivity به کاربرد. برنامه مىتواند گزارشهایى از قابلیتهاى Decoder و منابع تغییر سیستمى تهیه کند و طبق آن در فرستادن رشتههاى مناسب به Encode کمک کند.
امروزه مدیریت حقوق - ویژگیها (Property-rights) یکى از موارد مهم در دنیاى دیجیتال است. MPEG-4 رشتهها را توسط اعداد منحصربه فردى برچسب مىزند که این اعداد هم متعلق به Property Holderها هستند؛ پس مدیریت حقوق - دیجیتال امن هم ممکن است. اطلاعات حقوق همزمان با Metadataهاى دیگر رشته ذخیره مىشود ( Meta data اطلاعات مشخصه و دیگر دادههاى تشریحى است)، نتیجه این مىشود که دیگر لازم نیست براى تشخیص Owner یک رشته، کل رشته از Server گرفته شود. MPEG-4 یک مدل مشخص براى مدیریت حقوقها تعریف نمىکند، اما در عوض رابطى تعبیه مىکند که به Owner محتویات اجازه ایجاد یک راهحل مدیریتى براى نیازهاى خاص مىدهد.
Profileها:
MPEG-4 استانداردى بسیار جامع و فراگیر است. تاکنون هیچ نوع Media Player بوجود نیامده که تمام امکانات آنرا پیادهسازى کرده باشد. مثلاً یک تلفن همراه به صداى پنج کاناله نیاز ندارد یا گرافیکهایى را که به Render کردن نیاز داشته باشد پشتیبانى نمىکند. بنابراین این استاندارد تعدادى پروفایل تعریف مىکند که این پروفایلها حاوى ویژگیهایى هستند که محدوده قابلیتهاى یک Decoder را تعیین مىکنند. یک پروفایل مىتواند به چند Level تقسیم شود. وظیفه هر Level محدودکردن پیچیدگى محاسباتى است که Decoder باید درون پروفایل آنرا کنترل و اداره کند.
پروفایلها زیرمجموعههایى از مجموعه ابزارهاى MPEG-4 را مشخص مىکند. پروفایلهاى موجود عبارتند از پروفایل بصرى، صوتى، گرافیکى، گراف صحنهاى و توصیفکننده شىء. به عنوان نمونه، اساسىترین پروفایل بصرى براى تصاویر ویدئویى طبیعى، پروفایل Simple است. این پروفایل، ویدئوى مستطیلى شکل خطاناپذیر براى دستگاههاى کند و باپردازنده ضعیف (مثل تلفن همراه) در اختیار مىگذارد. سه سطح این پروفایل، حداکثر Bit Rate و دیگر جنبههاى رشتههاى ویدئویى را مشخص مىکند تا بتواند منابع Decoder را درخواست کند. پروفایلها در قسمتى از روشهاى وراثتى سازماندهى شدهاند تا پروفایل بعدى در زنجیره کلاً با محتویات طراحى شده براى دستگاهى با قابلیتهاى کمتر، سازگار باشد.
پروفایلها و Levelها به طراحان اجازه مىدهند پیادهسازى MPEG-4 خود را سازگار سازند. یعنى یک Audio Player محصول یک شرکت خاص که از پروفایل صوتى Scalable در سطح 3 پشتیبانى مىکند با یک Player از شرکت دیگر که ویژگیهاى پروفایل و Level آن مشابه اولى است، سازگار خواهد بود. سازگار بودن اعمال و توابع پیاده سازیهاى MPEG-4 به توافق کمپانیهاى مختلف بستگى دارد.
MPEG-4 تنها یک Vaporware نیست:
MPEG-4 چیزى فراتر از این گفتهها و ناگفتهها است. تعدادى از محصولاتى که از این تکنولوژى استفاده مىکنند در بازار یافت مىشوند و محصولات قویترى هم در راهند.
بعضى از کمپانیها هم بیکار ننشسته و از این تکنولوژى سوء استفاده مىکنند. مثلاً Napster ویدئوهایى را که به طریق غیرقانونى روى سایت خود پخش مىکند، توسط تکنولوژى MPEG-4 فشرده کرده است.
DivXNetworks یک Codec با تکنولوژى MPEG-4 به نام DivX طراحى کرده که قفل نرمافزارى DVD را (که با MPEG-2 فشرده شده) مىشکند و DVD را فشردهتر مىکند. DivXNetworks با بهبودبخشیدن به مدیریت حقوق - دیجیتال و همکارى نزدیک با کمپانیهاى پیشرو در زمینه MPEG-4 پیشرفت قابل توجهى در Mainstreamها داشته است.
Codec رایگان DivX5.0 و مجموعه 30 دلارى DivX Pro براى مشتاقان ویدئوى دیجیتال به عنوان ابزارهاى کلیدى هستند.
DivXNetworks با همکارى Sigma Designs یک کارت PCI با خروجى کد شده توسط DivX به نام REALmagic xCArd طراحى کرده و ساختهاند.
xCard و نرمافزار همراه آن قابلیت کار با ساختارهاى ویدئویى DVD، VCD، MPEG-1 و MPEG-2 و MPEG-4 را دارد. این کارت مجهز به خروجیهاى Composite و S-Video براى اتصال به تلویزیون است و یک کنترل از راه دور هم به همراه دارد.این کارت خروجیهایى هم براى صدا دارد و از صداهاى Dolby Digital Surroundپشتیبانى مىکند. اگر کامپیوتر و تلویزیون شما نزدیک یکدیگر قرار دارد با اتصال این دو به یکدیگر توسط xCardمىتوانید یک سیستم سرگرم کننده قوى در منزل خود داشته باشید.
قول MPEG-4 در مورد این موضوع که چند رسانهاىها را روى سیستمهاى دستى و تلفنهاى همراه منتقل خواهد کرد، توسط کمک پردازنده تصویرى IMAGEON001 محصول ATI به واقعیت پیوست. این تراشه در یک Package کوچک و کم مصرف براى استفاده روى سیستمهاى سیار، امکانات گرافیکى پیشرفتهاى ارائه کرده که شامل وضوح تصویرى و عمق رنگ بالاتر، بافرکردن فریمها و شتابدهنده سختافزارى جهت انجام Decompression مىباشد.
Panasonic هم در لباس الکترونیکى (E-wear) مدل SV-AV01 که یک MP3 Player با قابلیت ضبط و پخش است، ویدئوهاى MPEG-4 با ظرفیت پایین را نیز اجرا مىکند.
جادهاى در پیش راه؛ عریض و با کمى دستانداز:
MPEG-4 آمده تا نقش گستردهاى در دنیاى چندرسانهاىها و پخش آنها روى Platformهاى گوناگون بازى کند. این تکنولوژى همانند دیگر تکنولوژیهاى MPEG یک Open Standard است؛ یعنى هر کسى مىتواند از آن استفاده کند. به هر حال MPEG LA یکى از شرکتهاى قانونى اما مستقل از MPEG طرحى ارائه داده که طبق آن هزینهاى به عنوان MPEG-4 Licensing Fee دریافت شود: یک شارژ دقیقه به دقیقه براى دریافت رشتههاى MPEG-4. حامیان MPEG-4 مثل Apple (که قابلیتهاى MPEG-4 را در نرمافزار QuickTime تعبیه کرده) در کار دشوارى با یکدیگر همگام مىشوند.
این تکنولوژى مبتنى بر Open Standard براى کاربران خانگى خیلى جذاب است، چون اگر یک کمپانى محصول راضى کنندهاى ارائه ندهد رقباى دیگرش محصولى بهتر به بازار مىفرستند. این آزادى انتخاب کاربران رقابتى سالم بین توسعهدهندگان MPEG-4 بوجود آورده است. در گذشته این توسعه دهندگان هزینه License تکنولوژى MPEG را (که تنها یک بار دریافت مىگردد) پرداختهاند. کمپانیهاى درگیر با MPEGتاکنون پول زیادى صرف توسعه این استاندارد کردهاند و انتظار دارند عوض آنرا دریافت کنند. اگر توسعه دهندگان بتوانند با این هزینهها کنار بیایند و از کاربران این محصول توقع مادى زیادى نداشته باشند، مىتوان با جرأت گفت که MPEG-4 در آیندهاى نزدیک یک فرمت رسانهاى جهانى خواهد شد.
شرکتهاى پیشرو در عرصه MPEG-4:
Apple Computer, Inc.: www.apple.com
ATI Technologies, Inc.: www.ati.com
DivXNetworks, Inc.: www.divxnetworks.com & www.divx.com
MPEG: mpeg.telecomitalialab.com
MPEG LA: www.mpegla.com
Panasonic: www.panasonic.com
Sigma Designs, Inc.: www.sigmadesigns.com
نوشته شده توسط آرش در پنج شنبه 85/7/13 و ساعت 10:56 عصر |
نظرات دیگران()