Ефективне щоденне управління безпекою відіграє життєво важливу роль у запобіганні нещасним випадкам і покращенні якості будівництва. Однак управління безпекою будівництва все ще стикається з проблемами. Останніми роками інциденти, пов’язані з безпекою, залишаються поширеними, при цьому падіння становлять понад одну третину всіх травм, пов’язаних з будівництвом, що є найвищим рівнем випадків (Goh et al., 2022; Nadhim et al., 2016). У закритих приміщеннях зі слабким освітленням нещасні випадки при падінні часто пояснюють недостатнім захистом отворів у підлозі та стінах, а також відсутністю відповідних бар’єрів безпеки. Тому для керівників будівництва вкрай важливо швидко й точно визначати небезпечні місця та вживати профілактичних заходів для зменшення ризику таких інцидентів.
У конструкції були застосовані інтелектуальні технології для просторової локалізації цілей, включаючи систему глобального позиціонування (GPS) (Li et al., 2020), кінематичне позиціонування в реальному часі (RTK) (Su et al., 2014) і технологію одночасної локалізації та картографування (SLAM) (Yarovoi and Cho, 2024). Хоча системи GPS і RTK забезпечують високу точність локалізації, вони зазвичай вимагають дорогого обладнання. Вони чутливі до погіршення або втрати сигналу в складних умовах усередині приміщень, що може значно погіршити їх ефективність.
Навпаки, візуальні методи SLAM (VSLAM) працюють незалежно від прийому сигналу та оцінюють положення та орієнтацію камери на основі характеристик зображення. Крім того, VSLAM можна ефективно інтегрувати з комп’ютерним баченням (CV), щоб забезпечити одночасну ідентифікацію та локалізацію небезпеки. Примітно, що будівельні умови всередині приміщень зазвичай включають широкий спектр нагляду за безпекою, при цьому небезпеки розподіляються дуже нерівномірним і непередбачуваним чином. Традиційні монокулярні камери або камери з фіксованим оглядом пропонують обмежене поле огляду та часто вимагають кількох точок огляду для отримання повної інформації про сцену, що призводить до низької ефективності огляду. Панорамний візуальний SLAM із можливістю охоплення сцени на 360 градусів значно покращує збір даних і ефективність виявлення небезпеки, що робить його особливо вигідним для програм моніторингу безпеки в приміщенні (Венг та ін., 2025).
Алгоритми SLAM можуть створювати карти в своїх системах координат. Однак через відсутність інформації про глибину в монокулярному зорі отримані карти SLAM (Li et al., 2023) не мають справжнього масштабу, що ускладнює досягнення точного відстеження та локалізації руху в реальному світі (Jeelani et al., 2021). Таким чином, існуючі методи інтегрують додаткові датчики, такі як датчики глибини (El Bouazzaoui та ін., 2021), LiDAR (Венг та ін., 2025) або інерційні вимірювальні одиниці (IMU) (Чен та ін., 2023), щоб доповнити інформацію про глибину або рух, таким чином дозволяючи відновити справжній масштаб траєкторії локалізації. Незважаючи на те, що ці методи забезпечують високу точність просторової локалізації, вони вимагають точного мультимодального вирівнювання даних, а розгортання апаратного забезпечення та налаштування параметрів датчиків і пристроїв бачення є відносно складними.
Підходи на основі SLAM дозволяють локалізувати траєкторію камери спостереження та побудувати карти навколишнього середовища. Виходячи з цього, точна ідентифікація та просторова локалізація небезпечних цілей у межах захоплених зображень або відеопотоків залишається серйозною проблемою для досліджень. Існуючі методи зазвичай інтегрують алгоритми виявлення об’єктів для ідентифікації цільових об’єктів, таких як транспортні засоби (Li et al., 2023). Крім того, перетворення між координатами 2D-зображення та 3D-просторовими координатами зазвичай встановлюється за допомогою калібрування монокулярної камери з фіксованої точки огляду або сумісного калібрування з кількома камерами, що дозволяє оцінити реальні координати цілі (Li et al., 2023). Однак такі методи в основному підходять для просторової локалізації під фіксованими точками огляду, де поле зору камери мінімальне. Коли ціль виходить за межі видимого діапазону, необхідно розгорнути та відкалібрувати додаткові камери. Цей підхід погано підходить для завдань із багатоцільовою локалізацією в безперервних внутрішніх приміщеннях.
Щоб усунути обмеження щодо траєкторії, відновлення пози та просторової локалізації цілі, у цьому дослідженні запропоновано метод ідентифікації та локалізації будівельних небезпек на основі візуального SLAM та механізмів просторової трансформації. Конкретні цілі включають: (1) запропонувати метод розрахунку справжньої позиції шляхів локалізації на основі тріангуляції та перетворення подібності; (2) створити метод просторової локалізації будівельних небезпек на основі кластеризації щільності точок.
Це дослідження робить дослідницький внесок у двох аспектах. По-перше, дослідження пропонує метод відновлення справжньої пози траєкторій відстеження на основі перетворення простору координат зображення. Не потребуючи додаткових датчиків, метод використовує принципи панорамної просторової трансформації для ефективного відновлення справжнього масштабу та інформації про позицію траєкторій на основі SLAM. По-друге, це дослідження пропонує метод просторової локалізації на основі монокулярного зору під рухомою точкою спостереження. Завдяки інтеграції відстеження траєкторії на основі SLAM з кластеризацією точок перетину ліній спостереження, метод дозволяє локалізувати багато цілей у великих просторах за допомогою мобільних спостережень. Це дослідження пропонує теоретичну основу для дослідження багатоцільового розпізнавання та просторової локалізації за допомогою візуального SLAM (VSLAM), а також надає практичні рекомендації щодо проведення неінтрузивних інспекцій безпеки у великомасштабних будівельних просторах.
