Як Державна судова адміністрація гальмує розвиток legal tech в Україні
Держава збирає усі судові рішення, починаючи з кінця 2006 року. Усі вони – а їх нині понад 97 мільйонів – містяться у Єдиному державному реєстрі судових рішень.
Увесь цей масив цікавий для аналітиків даних, які проводять контент-аналіз рішень, та розробників, які створюють продукти на основі відкритих даних.
Наприклад, "Суд на долоні" є корисним "правникам", які прагнуть користуватися більшою кількістю фільтрів при пошуці, аніж є в державній версії Реєстру, чи тим, хто хоче віднайти рішення, якомога подібніші до текстів їхніх документів.Публікація також уможливлює створення алгоритмів природної мови, орієнтованих на юридичні документи.
Це означає, що ми можемо навчити нейронні мережі розуміти юридичний текст на базовому рівні. У майбутньому це дозволить створювати прогностичні та рекомендаційні системи.
Для того, щоби такі сервіси, як "Суд на долоні", швидко створювалися, розвивалися і допомагали юристам, розробникам необхідно мати якомога більше (а краще усі) текстів рішень. Однак, наразі із цим є певні проблеми.
Хоча розпорядники цих даних – Державна судова адміністрація та підконтрольні їй держпідприємства й публікують дані з Реєстру як набір відкритих даних, в складі цього набору є лише таблиці з метаданими рішень (в форматі CSV) та посиланнями на їх тексти (як файли) у форматі RTF чи HTML.
Самі ж тексти рішень потрібно завантажувати з серверів, на яких вони знаходяться, кожен окремо. Здавалося б, усе оприлюднюється і проблем не мало б виникнути. Але проблеми є.
Річ у тому, що тексти усіх рішень "важать" близько двох терабайтів, і необхідно витратити близько 9 місяців, аби завантажити їх усі.
Читайте також: Відкриті дані у держорганах: хто лідирує
У цієї проблеми є два не взаємовиключні розв'язання.
Перше – розпорядники могли б оприлюднювати заархівовані тексти рішень за певні місяці чи роки, завдяки чому зекономили б час для користувача та в рази зменшили навантаження на власні сервери.
Друге – запитувачі можуть відвідати розпорядників даних (Державної судової адміністрації чи її держпідприємство) і записати тексти судових рішень хоча б за 2006-2020 роки на носій інформації (наприклад, портативний жорсткий диск). Саме це і намагались зробити юристи Фундації DEJURE.
Однак Державна судова адміністрація пересилає такі запити на державне підприємство "Інформаційні судові системи", а останнє – відповідає, що запис даних на носій не передбачений законодавством.
Разом з тим, закон прямо дозволяє громадянам отримувати публічну інформацію в форматі відкритих даних за запит, в тому числі шляхом запису її на носій.
Щобільше, Постанова № 835 про відкриті дані говорить про те, що вивантаження інформації з баз даних (саме цього ми хочемо добитися від Державної судової адміністрації) не є створенням нової інформації, а лише перетворенням існуючої, що розпорядники зобов’язані робити на запит.
Читайте також: Відкриті дані в Україні: або ти їх, або вони тебе
В Україні вже існує такий прецедент – спільнота фахівців з відкритих даних Open Up виграла суд проти Мін’юсту щодо доступу до інформації Єдиного державного реєстру юридичних осіб та фізичних осіб-підприємців у форматі відкритих даних.
Суд визнав, що Мін’юст незаконно приховав значну частину інформації з ЄДР і зобов’язав надати повну у відповідь на запит.
Однак, Державна судова адміністрація та її підприємство проігнорувала законодавство, чим змусила юристів DEJURE звертатись до судів.
Наостанок звернемо увагу, що інформація з Реєстру судових рішень – один із найпопулярніших наборів на порталі відкритих даних, який постійно тримається в топ-10 за кількістю завантажень.
Саме тому надання доступу до інформації з нього слід вважати одним із пріоритетів, обмежуючи який означає обмежувати розвиток аналітики та legal-tech стартапів.
Сподіваємось, суд невдовзі стане на сторону громадян та захистить наше право на інформацію, що належить платникам податків.
Андрій Химчук