اینترنت بدون گوگل
اینترنت (در آن زمان ARPANET نامیده می شد) در سال 1969 متولد شد. با این حال، اولین سرویس جستجو تا سال 1990 در دسترس نبود. آیا می توانید تصور کنید که اینترنت بدون موتورهای جستجو برای تقریبا 20 سال چگونه وجود داشت؟ کاربران با این کار راحت بودند، زیرا اطلاعات زیادی در این چارچوب موجود نبود و مردم میتوانستند آن را مستقیماً، از طریق رسانههای چاپی و غیره به اشتراک بگذارند. هنگامی که موتورهای جستجو به وجود آمدند، فکر کردن به زندگی بدون آنها غیرممکن شد.
سیستم های دوربین مدار بسته مدرن را می توان با «اینترنت بدون گوگل» مقایسه کرد. بدیهی است که این کار ناکارآمد و ناخوشایند است. با 10 تا 20 دوربین، اگر به یاد داشته باشید که دوربین ها کدام صحنه ها را پوشش می دهند و می دانید چه کسی یا چه چیزی را باید جستجو کنید، می توانید به صورت دستی جستجو کنید تا اطلاعات مورد نیاز خود را بیابید. اما وقتی 500 دوربین دارید، بدون فناوری جستجو نمی توانید از پس آن برآیید.
یک رابط راحت: آغاز یک ابزار جستجو
اولین فناوریهایی که بذر جستجوی ویدیویی را تشکیل دادند، مربوط به توسعه رابطهای کاربردی و کاربرپسند بودند. حتی نشان دادن تاریخ و زمان دقیق روی فیلم نیز برای امکان جستجو بر اساس این معیارها کافی بود. مشخص شد که تقاضا برای ابزارهایی وجود دارد که کار اپراتور را آسان کند. و اولین ایدهها دوباره به رابطهایی مرتبط بودند که یافتن رویدادها را راحت و آسان میکنند.
یکی از این موارد جستجوی یک رویداد محرک به صورت تقریبی است (مثال آن زمانی است که ویدیو نشان میدهد که یک خودرو از محل پارک خود ناپدید شده است). برای انجام این کار، یک بخش طولانی از آرشیو به چندین قسمت مساوی تقسیم می شود. به عنوان مثال، یک ویدیوی 12 ساعته به 12 قسمت یک ساعته تقسیم می شود و صفحه نمایش پیش نمایشی از هر قسمت (چند فریم اول هر بخش) را نشان می دهد. این به شما امکان می دهد تشخیص دهید که کدام بخش از ویدیو هنوز شی در آن وجود دارد و در کدام بخش از بین رفته است، به این معنی که رویداد ماشه در آن محدوده زمانی رخ داده است.
با تقسیم تدریجی هر بخش به بخش های کوچکتر، می توانید در نهایت زمان رویداد را تا دوم تعیین کنید. در مورد ضبط 12 ساعته، برای یافتن رویداد فقط به چهار کلیک نیاز دارید. این جستجوی هوشمندانه به نظر می رسد ، اینطور نیست؟ اما در واقع فقط یک ویژگی رابط خوب است.
جستجوی LPR: اولین فناوری هوشمند
علیرغم کارایی جستجوی قطعات، همه نیازها را برآورده نمی کند. به عنوان مثال، شما نمی توانید ببینید چه کسی وارد یک منطقه خاص شده است، یا تمام خودروهایی که در میدان دید دوربین قرار دارند را پیدا کنید.
اولین جستجوی واقعاً هوشمند، فناوری تشخیص پلاک بود . الگوریتم های تشخیص پلاک و تبدیل تصویر به متن در واقع از زمان سیستم های آنالوگ وجود داشته است. این الگوریتمها میتوانند تمام پلاکهایی را که در یک قاب نشان داده میشوند شناسایی کنند و سپس آن رکوردها را مانند جستجو در یک دفترچه یادداشت جستجو کنند. (با پیشرفتهای اخیر در الگوریتمهای تشخیص، اکنون فناوریهای مشابهی برای جستجوی چهرهها داریم.)
بنابراین ایده توصیف یک صحنه از قبل به منظور استفاده از این داده ها برای جستجو، قبلاً در اطراف شناور بود. این فقط فاقد ابزار توصیف صحنه ها بود و اینها در طول زمان پدیدار شدند – فناوری هایی برای توصیف چهره ها با عبارات هندسی و ردیابی رفتار اشیا. ترکیب همه این ابزارها امکان تولید ابرداده ای را فراهم کرده است که صحنه و هر چیزی را که در آن وجود دارد را با دقت بالایی تعریف می کند.
اگر جستجو فوری نباشد، بیهوده است
در این مرحله، یک سوال جدی مطرح شد: ابرداده ها در کجا باید ذخیره شوند؟ بازار ابزارهای مؤثری را ارائه نکرد که هم بتواند داده ها را ذخیره کند و هم در توصیف هندسی یک صحنه جستجو کند. پایگاههای دادههای رابطهای معمولی برای اطلاعات ساختاریافتهای طراحی شدهاند که میتوانند نمایه شوند (فیلدهایی مانند “قد، وزن، اندازه قفسه سینه، سابقه کیفری، مجوز امنیتی”). اما دادههای هندسی آرایهای بینظم از اعداد هستند که به سرعت تولید میشوند، زیرا اشیاء درون قاب دائما در حال حرکت هستند. در عین حال، ذخیره تا حد امکان داده ها (مختصات شی، اندازه، رنگ و غیره) مهم است، زیرا هرچه اطلاعات بیشتری در مورد شی موجود باشد، یافتن آن آسان تر خواهد بود. این نوع داده ها را می توان در یک پایگاه داده رابطه ای ذخیره کرد، اما جستجو بسیار کند خواهد بود.
مشکل دیگر این بود که در توصیف صحنه، هیچ راهی برای فیلتر کردن داده ها به اطلاعات مفید، بی فایده و بد وجود نداشت. همه چیز باید ذخیره می شد و شرح صحنه باید تا حد امکان دقیق باشد. تا زمان جستجو هیچ راهی برای دانستن مفید یا مضر بودن یک رویداد وجود نداشت. بنابراین هنگام جستجوی شخصی در بوته ها، خش خش باد در بوته ها آلارم کاذب ایجاد می کند که اطلاعات بدی است. اما اگر به دنبال اطلاعاتی در مورد اینکه آیا باد در نقطه خاصی می وزد یا خیر، کسی در بوته ها اطلاعات بدی را دریافت می کند، در حالی که بوته های خش خش اکنون مفید هستند زیرا از باد حرکت می کنند.
در طول یک جستجو، نسبت اطلاعات مفید به تمام اطلاعات دیگر عمدتاً به میزان مشخص بودن معیار جستجو بستگی دارد. تعیین موثرترین معیارها در اولین تلاش تقریباً غیرممکن است، بنابراین همیشه باید آنها را تغییر داده و تنظیم کنید (یک خط کوتاه یا بلندتر کنید، گرادیان رنگ را تغییر دهید، منطقه کادر جستجو را بزرگ یا باریک کنید، و غیره) . تنها راه انجام این کار آزمایش است، بنابراین جستجو تنها در صورتی کارآمد است که نتایج آنی باشند و معیارهای جستجو را بتوان بلافاصله تنظیم کرد. اگر اصلاً باید منتظر بمانید، هیچ فایده ای برای آن وجود ندارد، زیرا کاربر پس از 2 یا 3 بار تلاش به سادگی تسلیم می شود. قیاس با اینترنت نیز در اینجا مناسب است: هنگامی که به سرعت نتایج جستجو را دریافت می کنید، می توانید پرس و جو جستجوی خود را با کلمات کلیدی مختلف تطبیق دهید. اگر بعد از هر جستجو پنج دقیقه منتظر بمانید، حوصله پیدا کردن کلمات کلیدی مناسب و دریافت نتایج را ندارید. به همین دلیل است که جستجوی فوری بسیار مهم است: این چیزی است که سیستم را موثر می کند.
با بازگشت به مشکل ذخیره سازی فراداده، تا یک نقطه خاص، هیچ سیستم ذخیره سازی موجودی وجود نداشت که امکان بازیابی فوری نتایج جستجو را فراهم کند. برای حل این مشکل، شرکت ها روی تحقیق و توسعه گران قیمت سرمایه گذاری کردند که منجر به ایجاد رسانه های منحصر به فرد بهینه شده برای ذخیره داده های هندسی شد، بنابراین اکنون آنها فناوری استخراج سریع اطلاعات را دارند. به این ترتیب آنها میتوانند سیستمهای جستجوی خود را واقعاً مؤثر کنند و میتوانند به طور کامل با چالشهای سیستمهای امنیتی شهری و منطقهای که هزاران و دهها هزار دوربین را در بر میگیرند، مقابله کنند.
آینده جستجوی هوشمند
موتورهای جستجو هر روز در حال بهبود هستند، اما این مسیر توسعه در نهایت به حد خود خواهد رسید، زیرا تنها جنبه ای که در حال توسعه است، ابزارهایی برای تولید توصیف صحنه های کیفی است. ممکن است تعداد بیشتری از آنها توسعه یابند، و ممکن است گسترده تر، دقیق تر و غیره شوند. اما آینده به وضوح متعلق به سیستم هایی است که نه تنها می توانند صحنه را توصیف کنند، بلکه می توانند آنچه را که در صحنه اتفاق افتاده است تفسیر کنند، به این معنی که می توانند نشانگرهای معنایی را اضافه کنند.
در حال حاضر، اپراتور به دنبال مقداری حرکت در صحنه است که تا آنجا که به نرم افزار مربوط می شود، فقط حرکت اشیاء انتزاعی است. در بهترین حالت، آن را به عنوان “فرد، ماشین، یا انبوه مردم” طبقه بندی می کنند، اما نسبتاً خودسرانه است. آنچه مورد نیاز است این است که VMS شروع به درک آنچه که اشیاء در صحنه انجام می دهند، کند. برای مثال، موقعیتی را در نظر بگیرید که در آن مردی ماشینی را خراشید. خیلی خوب خواهد بود اگر VMS تشخیص دهد که شیء 1 به شیء 2 نزدیک نشده است و سپس آنها از هم جدا می شوند، بلکه به طور خاص شخصی است که ماشینی را خراشیده است، نه باز کردن آن یا نگاه کردن به داخل. آینه بغل زمانی که سیستم بتواند ارزیابی معناداری از آنچه در حال رخ دادن است انجام دهد، ارزیابی رفتار اشیاء در کادر و شناسایی فعالیت های «مشکوک» و غیره امکان پذیر خواهد بود. به طور طبیعی، این یک جهش حیرتانگیز در کیفیت جستجو خواهد بود و با توصیف معنایی صحنه پیش میرود.
در سالهای آینده، بیشتر تلاشها بر روی ایجاد ابزارهایی متمرکز خواهد شد که یافتن بخش مناسب از آرشیو ویدئو را بر اساس توضیحات کیفی برای اپراتور آسانتر و سریعتر میکند. این امکان وجود دارد که دید استریوسکوپی با افزودن یک بعد دیگر کمک کند، که این امکان را فراهم می کند تا ببینیم یک شی چقدر از دید دوربین فاصله دارد. این به اپراتور اجازه می دهد تا اشیا را بر اساس درجه فاصله یا هندسه واقعی اندازه جسم جستجو کند (ابعاد نسبی در حال حاضر استفاده می شود).
همه ما هنوز در آغاز این سفر هستیم. سال 2016 روند آشکاری را نشان داد، زیرا مردم به اهمیت جستجو پی بردند و به ابزارهای موجود علاقه مند شدند. برای پروژههای شهر ایمن ، جستجوی فوری چند دوربینی برای چهرهها، LPR، و هر چیز و رویداد دیگری در حجم عظیمی از فیلمبرداریها ضروری است. بنابراین به احتمال زیاد به زودی شاهد برخی تغییرات اجتناب ناپذیر خواهیم بود: هر سیستم نظارت تصویری، صرف نظر از مقیاس آن، به سادگی باید ابزارهای جستجو مانند مواردی را که در این مقاله توضیح داده شده یا موارد مشابه را در خود جای دهد. عصر “اینترنت بدون گوگل” در راه است و هرگز باز نخواهد گشت.