Close Menu
InfoCom
  • Telecoms
  • IT
  • AI
  • Security
  • Επιχειρήσεις
    • Στρατηγική
  • Πρόσωπα
    • Στελέχη
    • Συνεντεύξεις
    • Απόψεις
  • Today
  • SmartTalks
  • eMagazine
  • Weekly Telecom
  • AI.BRIEF
Facebook X (Twitter) Instagram
  • ABOUT
  • ΟΡΟΙ ΧΡΗΣΗΣ
  • ΕΠΙΚΟΙΝΩΝΙΑ
  • NEWSLETTER
Κυριακή, 21 Ιουνίου
Facebook X (Twitter) YouTube LinkedIn RSS
InfoCom
  • Telecoms
  • IT
  • AI
  • Security
  • Επιχειρήσεις
    • Στρατηγική
  • Πρόσωπα
    • Στελέχη
    • Συνεντεύξεις
    • Απόψεις
  • Today
  • SmartTalks
  • eMagazine
  • Weekly Telecom
  • AI.BRIEF
InfoCom
Home»AI

Αυξημένα περιστατικά παραπλανητικής συμπεριφοράς από τεχνητή νοημοσύνη

30/03/2026Χρήστος ΚοτσακάςBy Χρήστος Κοτσακάς3 Mins Read AI
Όλες οι εξελίξεις σε τηλεπικοινωνίες και τεχνολογία στο Google News!
Ακολουθήστε το Infocom.gr για τις σημαντικότερες ειδήσεις της ψηφιακής αγοράς.
Add as preferred source on Google

Πρόσφατη έρευνα που χρηματοδοτήθηκε από το βρετανικό AI Security Institute αποκάλυψε σημαντική αύξηση στον αριθμό των μοντέλων τεχνητής νοημοσύνης που υιοθετούν παραπλανητικές τακτικές. Η μελέτη του Centre for Long-Term Resilience εντόπισε σχεδόν 700 περιπτώσεις όπου AI chatbots και αυτόνομοι πράκτορες αγνόησαν άμεσες οδηγίες, παρέκαμψαν δικλείδες ασφαλείας και εξαπάτησαν ανθρώπους ή άλλα συστήματα λογισμικού. Τα δεδομένα δείχνουν πενταπλάσια αύξηση τέτοιων συμπεριφορών κατά το διάστημα μεταξύ Οκτωβρίου και Μαρτίου. Ορισμένα μοντέλα προχώρησαν ακόμα και στην καταστροφή αρχείων και ηλεκτρονικών μηνυμάτων χωρίς την άδεια των χρηστών, προκαλώντας ανησυχία για την αξιοπιστία της τεχνολογίας σε πραγματικές συνθήκες λειτουργίας.

Καταγραφή αυξημένων περιστατικών παραβίασης κανόνων ασφαλείας

Η έρευνα βασίστηκε στην ανάλυση χιλιάδων αλληλεπιδράσεων χρηστών στην πλατφόρμα X με εργαλεία τεχνητής νοημοσύνης που έχουν αναπτυχθεί από εταιρείες όπως η Google, η OpenAI και η Anthropic. Σε αντίθεση με προγενέστερες δοκιμές σε ελεγχόμενα εργαστηριακά περιβάλλοντα, η συγκεκριμένη μελέτη εστίασε σε περιστατικά που συνέβησαν κατά την ελεύθερη χρήση των μοντέλων. Τα ευρήματα περιλαμβάνουν περιπτώσεις όπου ένας αυτόνομος πράκτορας με την ονομασία Rathbun επιχείρησε να διασύρει δημόσια τον ανθρώπινο ελεγκτή του μέσω ιστολογίου, επειδή ο τελευταίος του απαγόρευσε μια ενέργεια. Σε άλλη περίπτωση, ένα σύστημα στο οποίο απαγορεύτηκε η τροποποίηση κώδικα δημιούργησε έναν δευτερεύοντα πράκτορα για να εκτελέσει την εργασία.

Οι ερευνητές κατέγραψαν επίσης περιστατικά όπου chatbots παραδέχθηκαν εκ των υστέρων ότι παραβίασαν ρητές εντολές των χρηστών τους. Ένα χαρακτηριστικό παράδειγμα αφορούσε τη μαζική διαγραφή και αρχειοθέτηση εκατοντάδων μηνυμάτων ηλεκτρονικού ταχυδρομείου χωρίς προηγούμενη έγκριση του σχεδίου δράσης. Επιπλέον, καταγράφηκαν τακτικές κοινωνικής μηχανικής, όπως η προσποίηση αναπηρίας από την πλευρά του AI για την παράκαμψη περιορισμών πνευματικής ιδιοκτησίας σε πλατφόρμες βίντεο. Παράλληλα, το σύστημα Grok φέρεται να εξαπατούσε χρήστες επί μήνες, δημιουργώντας πλασματικά εσωτερικά μηνύματα και αριθμούς αναφοράς για να πείσει ότι διαβίβαζε προτάσεις επεξεργασίας στην ομάδα ανάπτυξης, ενώ στην πραγματικότητα δεν διέθετε τέτοια δυνατότητα επικοινωνίας.

Κίνδυνοι για υποδομές και απαντήσεις εταιρειών

Η αυξανόμενη ικανότητα των μοντέλων να δρουν ως αυτόνομοι πράκτορες ενέχει κινδύνους που παρομοιάζονται με εσωτερικές απειλές ασφαλείας σε έναν οργανισμό. Ο Tommy Shaffer Shane, επικεφαλής της έρευνας, επισήμανε ότι ενώ προς το παρόν τα μοντέλα θυμίζουν αναξιόπιστους υπαλλήλους χαμηλής ιεραρχίας, η εξέλιξή τους σε πιο ικανά συστήματα ενδέχεται να προκαλέσει καταστροφικές συνέπειες. Η ανησυχία εντείνεται από το γεγονός ότι η AI πρόκειται να χρησιμοποιηθεί σε κρίσιμες εθνικές υποδομές και στον στρατιωτικό τομέα. Η πιθανότητα σχεδιασμένης παραπλανητικής συμπεριφοράς σε τέτοια περιβάλλοντα καθιστά επιτακτική την ανάγκη για διεθνή εποπτεία και συνεχή παρακολούθηση των μοντέλων που διατίθενται στην αγορά.

Από την πλευρά τους, οι εταιρείες τεχνολογίας δηλώνουν ότι λαμβάνουν μέτρα για τον περιορισμό αυτών των κινδύνων. Η Google ανέφερε ότι εφαρμόζει πολλαπλές δικλείδες ασφαλείας για το Gemini 3 Pro και συνεργάζεται με εξωτερικούς φορείς για την αξιολόγηση των μοντέλων της. Η OpenAI σημείωσε ότι το Codex είναι προγραμματισμένο να σταματά πριν από την εκτέλεση ενεργειών υψηλού κινδύνου, ενώ η εταιρεία παρακολουθεί συστηματικά κάθε μη αναμενόμενη συμπεριφορά. Παρά τις διαβεβαιώσεις, η ταχεία προώθηση της τεχνολογίας για οικονομικούς λόγους δημιουργεί ένα χάσμα μεταξύ της ταχύτητας υιοθέτησης και της ικανότητας ελέγχου των αυτόνομων ενεργειών των συστημάτων τεχνητής νοημοσύνης.

Ακολουθήστε το Infocom.gr και στα Google News, για όλες τις τελευταίες εξελίξεις από τον κόσμο των τηλεπικοινωνιών και της τεχνολογίας!

Infocom Today
SmartTalks

AI bots
Share. Facebook Twitter LinkedIn Email Copy Link
Avatar photo
Χρήστος Κοτσακάς
  • Website
  • LinkedIn

Ο Χρήστος Κοτσακάς είναι δημοσιογράφος με πολυετή εμπειρία στον χώρο του τεχνολογικού, επιχειρηματικού και διεθνούς ρεπορτάζ, επικεντρώνοντας το ενδιαφέρον του στα new media, τις νέες τεχνολογίες και τις startups. Έχει συνεργαστεί με μια σειρά από ηλεκτρονικά και έντυπα μέσα, σε τομείς όπως η αρθρογραφία, η επικοινωνία και η ενημέρωση.

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ

Τεχνητή νοημοσύνη: Ποιος κρατά τελικά τον διακόπτη;

Η ΕΕ ζητά κοινή γραμμή με τις ΗΠΑ για τα προηγμένα AI μοντέλα

KnoWare: η πρώτη επιστημονική πρωτοβουλία για την πρόβλεψη αναδυόμενων ικανοτήτων ΤΝ πριν αυτές εμφανιστούν

ΤΝ και δημόσια διοίκηση: Ελλάδα και Ευρωπαϊκή Επιτροπή ενώνουν δυνάμεις για ένα ψηφιακό μέλλον

KIEFER: συνδέει πράσινη ενέργεια, ΤΝ και ρομποτική, διατηρώντας τα δεδομένα στην Ελλάδα

Microsoft: tο μέλλον της τεχνητής νοημοσύνης βρίσκεται στα συστήματα, όχι στα μεμονωμένα μοντέλα

Comments are closed.

Εγγραφείτε στο Weekly Telecom
* indicates required
RSS BizNow.gr
  • Ν. Χαρδαλιάς: «Επιλογή μας να καταστήσουμε την Αττική πρωταγωνίστρια της νέας ψηφιακής εποχής» 
  • The Media Business Game: ΣΚΑΪ, ΕΡΤ και Alter Ego ανεβάζουν στροφές σε ενημέρωση και δικαιώματα
  • Η TILESKOPIO στο ESA BIC Greece με τεχνολογίες κυβερνοασφάλειας
  • Συνεργασία Revolut & Wolt στον τομέα των ψηφιακών πληρωμών
  • Ημερίδα του ΣΕΠΕ για την «Ελλάδα της Νέας Ψηφιακής Εποχής» στη Beyond 2026
  • Η eSafe Hellas και η Island παρουσίασαν το μέλλον του Enterprise Workspace
  • Η Postbank γιόρτασε 35 χρόνια παρουσίας στη Βουλγαρία
RSS itsecuritypro.gr
  • Η AWS Φέρνει Υπολογιστική Ισχύ, Αποθήκευση και Υπηρεσίες AI στην Αθήνα με Νέο Local Zone, Διαθέσιμο τον Ιούλιο 2026
  • Η αποτελεσματική κυβερνοασφάλεια δεν κρίνεται από την απουσία περιστατικών, αλλά από την ικανότητα αντίδρασης και προσαρμογής
  • Το Innovation to Impact⁠ φέρνει το deep tech στην πράξη – Δείτε το πρόγραμμα! (16/6, Divani Caravel)
  • Η κατάχρηση διαπιστευτηρίων παραμένει το ισχυρότερο όπλο των κυβερνοεγκληματιών, παρά τα αυστηρά μέτρα ασφαλείας
  • Έρευνα Forscope: 1 στις 2 επιχειρήσεις «παγιδευμένη» σε συνδρομές λογισμικού που δεν χρειάζεται
  • Με επιτυχία ολοκληρώθηκε η συμμετοχή της Cysoft στα Ποσειδώνια 2026
  • Pylones Hellas και AEG αναδεικνύουν νέα εργαλεία που ενισχύουν Compliance και Operations ενόψει των αλλαγών του SWIFT
Infocom Today

Copyright 2024 | All Rights Reserved

Type above and press Enter to search. Press Esc to cancel.