Автономні AI-агенти в кібербезпеці: від тренажерних середовищ до бойового застосування
DOI:
https://doi.org/10.37750/2616-6798.2026.2(57).364427Ключові слова:
кібербезпека, штучний інтелект, автономні агенти, кібероперації, reward hackingАнотація
Стаття присвячена дослідженню автономних AI-агентів у сфері кібербезпеки та їх трансформації від експериментальних систем навчання до інструментів практичного застосування у кіберопераціях. На основі системного аналізу сучасних архітектур штучного інтелекту та емпіричних даних змагань KICRF’26 запропоновано авторську класифікацію AI-агентів за рівнем операційної автономії. Проведено аналіз феномену reward hacking як системного відмовного режиму автономних систем. Запропоновано концепцію “зони правової невизначеності автономного агента” та модель диференційованої відповідальності розробника. Окреслено сценарії розвитку автономних кіберсистем у середньостроковій перспективі.
Посилання
Rid T. Cyber War Will Not Take Place. London: Hurst, 2013. 256 p.
Singer P., Friedman A. Cybersecurity and Cyberwar: What Everyone Needs to Know. Oxford University Press, 2014. 320 p.
Sutton R., Barto A. Reinforcement Learning: An Introduction. MIT Press, 2018. 552 p.
Amodei D. et al. Concrete Problems in AI Safety. arXiv preprint arXiv:1606.06565. 2016.
Pan A. et al. The Effects of Reward Misspecification in Reinforcement Learning Systems. Proceedings of the AAAI Conference on Artificial Intelligence. 2022.
Guss W., Czarnecki W., Jayakumar S. CyberBattleSim: A Reinforcement Learning Research Platform for Cybersecurity. Microsoft Research. 2021.
Schmitt M. Tallinn Manual 2.0 on the International Law Applicable to Cyber Operations. Cambridge University Press, 2017.
Goodfellow I., Bengio Y., Courville A. Deep Learning. MIT Press, 2016.
Russell S., Norvig P. Artificial Intelligence: A Modern Approach. 4th ed. Pearson, 2021.