Format:
Online Ressource (81 S., 2.612 KB)
,
graph. Darst
Content:
Alignmentbasierte Methoden werden routinemäßig für die funktionale Charakterisierung neuer Proteinsequenzen verwendet. Rechentechnisch sind diese Methoden für große Sequenzmengen jedoch sehr aufwändig.In dieser Arbeit werden zwei neue Methoden zur alignmentfreien Repräsentation und Analyse von Proteinsequenzen vorgestellt. Die Methoden sind in Kombination mit geeigneten Verfahren des maschinellen Lernens zur Detektion entfernter Homologien und zur Proteinklassifikation auf großen Sequenzmengen verwendbar. Die Evaluation der Methoden auf einem weit verbreiteten Testdatensatz zur Detektion entfernter Homologien demonstriert ihre Leistungsfähigkeit sowie die rechentechnische Effizienz und zeigt, wie die Methoden zur biologischen Interpretation gelernter Merkmale genutzt werden können. Weiterhin werden die Methoden auf einem im Rahmen dieser Arbeit erstellten umfassenden Testdatensatz zur Proteinfunktionsvorhersage mit einem angepassten Verfahren des maschinellen Lernens evaluiert. Die Ergebnisse dieses Ansatzes unterstreichen die generelle Eignung der Methoden zur Untersuchung verschiedener Probleme auf dem Gebiet der Proteinsequenzanalyse.
Note:
Göttingen, Univ., Diss., 2008
Language:
German
Keywords:
Hochschulschrift
URN:
urn:nbn:de:gbv:7-webdoc-1909-6
URL:
Volltext
(kostenfrei)
URL:
Volltext
(kostenfrei)
Bookmarklink