Please use this identifier to cite or link to this item: http://dx.doi.org/10.14279/depositonce-10929
For citation please use:
Main Title: Social Cobots: Anticipatory Decision-Making for Collaborative Robots with Extended Human Adaptation
Translated Title: Soziale Cobots: Antizipatorische Entscheidungsfindung bei kollaborativen Robotern mit erweiterter menschlicher Adaptation
Author(s): Görür, Orhan Can
Advisor(s): Albayrak, Sahin
Referee(s): Albayrak, Sahin
Haddadin, Sami
Hoffman, Guy
Granting Institution: Technische Universität Berlin
Type: Doctoral Thesis
Language Code: en
Abstract: One of the biggest concerns about collaborative robots (cobots) is their ability to adapt during their interactions with humans, which typically exhibit an immense diversity. We present an autonomous framework as a robot's real-time decision-making mechanism to anticipate and adapt to a great deal of human characteristics and behaviors, including human errors, toward a fluent and personalized human-robot collaboration. Our novel anticipatory architecture handles human behaviors in two levels: short-term context-dependent human behaviors, e.g., lost attention; long-term changing human characteristics, e.g., expertise. For the short-term adaptation, we implement a novel decision-making mechanism called anticipatory partially observable Markov decision process (A-POMDP). Our contribution lies in the ability of our model to handle the following human conditions to more accurately estimate the human’s need for help: 1) when the human's intention is estimated to be irrelevant to the assigned task, e.g., motivation is lost; 2) when the human does not want the robot's assistance in the given context, e.g., because of the human's distrust. For the long-term adaptation, we present a novel policy selection mechanism called Anticipatory Bayesian Policy Selection (ABPS), which is built on existing intention-aware models. ABPS selects from the set of policies that are generated from different A-POMDPs, each of which handles a different human’s short-term changing behaviors. The selection is based on the estimation of the human's long-term workplace characteristics, such as level of expertise, stamina, attention, and collaborativeness. We design a simulated factory environment consisting of crafted novel human behavior models collaborating at a conveyor belt with our robot to train our robot models and to conduct rigorous tests with greater uncertainty. Then, we integrate our solutions as an autonomous robotic framework and deploy it on a small-scale conveyor belt and a robot arm. Our novel setup presents a cognitively challenging task within a distractive environment to feature diverse human behaviors. We conduct user studies and the results show that our applied framework with extended human adaptation, covering changing human behaviors and their long-term characteristics, increases the efficiency and naturalness of the collaboration with a higher perceived collaboration, positive teammate traits, and human trust when compared to existing anticipatory solutions that do not handle such behaviors.
Eines der größten Probleme kollaborativer Roboter (Cobots) betrifft ihre Anpassungsfähigkeit während ihrer Interaktionen mit Menschen, die typischerweise eine immense Vielfalt aufweisen. Wir stellen ein autonomes Rahmenwerk als Echtzeit-Entscheidungsmechanismus eines Roboters vor, des einen Großteil der Eigenschaften und Verhaltensweisen des Menschen, einschließlich menschlicher Fehler, antizipiert und sich an diese anpasst, um eine flüssige und personalisierte Mensch-Roboter-Kollaboration zu ermöglichen. Unsere neuartige antizipierende Architektur behandelt solche Verhaltensweisen auf zwei Ebenen: kurzfristige kontextabhängige menschliche Verhaltensweisen, z.B. verlorene Aufmerksamkeit, und langfristig sich verändernde menschliche Charakteristiken, z.B. das Expertenwissen. Für die kurzfristige Anpassung implementieren wir einen neuartigen Entscheidungsmechanismus, den wir „Anticipatory Partially Observable Markov Decision-making Process (A-POMDP)“ nennen. Unser Beitrag liegt in der Fähigkeit unseres Modells, mit den folgenden menschlichen Zuständen umzugehen, um die Bedürfnisse des Menschen genauer einschätzen zu können: 1) wenn die Intention des Menschen als irrelevant für die zugewiesene Aufgabe eingeschätzt wird, z.B. wenn die Motivation verloren geht; 2) wenn der Mensch die Hilfe des Roboters im gegebenen Kontext nicht möchte, z.B. wegen des Misstrauens des Menschen. Für die langfristige Anpassung stellen wir einen neuartigen Policy-Auswahlmechanismus vor, der wir „Anticipatory Bayesian Policy Selection (ABPS)“ nennen. ABPS baut auf bestehenden Intentions-bewusste Modellen und wählt aus einem bestehenden Satz von Strategien (Policies) aus, die aus verschiedenen A-POMDPs generiert werden. Die Auswahl dieser Strategien basiert auf der Einschätzung der langfristigen menschliche Merkmale am Arbeitsplatz, wie z.B. Grad der Fachkenntnis, Ausdauer, Aufmerksamkeit und Kooperationsfähigkeit. Wir entwerfen eine simulierte Fabrikumgebung, die aus unseren neuartigen Modellen menschlichen Verhaltens besteht, die mit unserem Roboter an einem Förderband zusammenarbeiten, um unsere Robotermodelle zu trainieren und strenge Tests mit größerer Unsicherheit konfrontieren. Dann integrieren wir unsere Lösungen als autonomes Roboter-Rahmenwerk auf einem kleinen Förderband und einem Roboterarm. Unser neuartiger Experiment-Aufbau stellt eine kognitiv herausfordernde Aufgabe in einer ablenkenden Umgebung dar, in der unterschiedliche menschliche Verhaltensweisen auftreten. Wir führen Benutzerstudien durch, und die Ergebnisse zeigen, dass unser angewandtes Rahmenwerk mit erweiterter menschlicher Anpassung, das sich ändernde menschliche Verhaltensweisen und deren langfristige Charakteristika abdeckt, die Effizienz und Natürlichkeit der Zusammenarbeit im Vergleich zu bestehenden vorausschauenden Lösungen, die mit solchen Verhaltensweisen nicht umgehen, erhöht.
URI: https://depositonce.tu-berlin.de/handle/11303/12055
http://dx.doi.org/10.14279/depositonce-10929
Exam Date: 11-Nov-2020
Issue Date: 2020
Date Available: 17-Dec-2020
DDC Class: 004 Datenverarbeitung; Informatik
Subject(s): human-robot collaboration
collaborative robots
anticipatory decision-making
human intention estimation
planning under uncertainty
Mensch-Roboter-Kollaboration
kollaborative Roboter
antizipatorische Entscheidungsfindung
Vorhersage der Intention
stochastische Planung
License: https://creativecommons.org/licenses/by-nc-nd/4.0/
Appears in Collections:FG Agententechnologien in betrieblichen Anwendungen und der Telekommunikation (AOT) » Publications

Files in This Item:
goeruer_orhan_can.pdf
Format: Adobe PDF | Size: 44.27 MB
DownloadShow Preview
Thumbnail

Item Export Bar

This item is licensed under a Creative Commons License Creative Commons