RPM Repository Management mit pulp

In Service Transitions gibt es häufig die Anforderung, dass Server keinen direkten Zugriff auf Software-Quellen aus dem Internet bekommen dürfen.

Für den Betrieb stellt dies gelegentlich eine Herausforderung dar, wenn es beispielsweise in einem spezifischen Setup keine Möglichkeit gibt, um rpm-Paketquellen zentral von einem Repository-Service zu beziehen. Oft spielen auch Aufwand und Lizenzgebühren eine große Rolle, denn es ist zwar eine Auswahl an Tools vorhanden, jedoch sind diese teilweise für den Service unverhältnismäßig komplex oder schlichtweg zu kostenintensiv.

Wenn es darum geht, eine zentrale Schnittstelle für die Bereitstellung von Software zu schaffen, so ist pulp (pulpproject.org) eine mögliche Lösung. Es werden dabei folgende Formate unterstützt:

RPM (auch DRPM und SRPM, Errata)
Python-PyPI
Puppet-modules
Docker-modules
OSTree

Dieser Artikel soll sich vor allem an diejenigen richten, die eine Lösung suchen um RPM-Repositories zu verwalten. Nachfolgend sollen einige Schlagworte genannt werden um einen kleinen Überblick zu geben, was pulp in diesem Rahmen leistet und was (noch) nicht. Bezüglich der Verwaltung der Formate unabhängig von RPM, wird keine Aussage getroffen.

Features

Single Point of Access – Clients benötigen im Betrieb keinerlei Verbindung zu externen RPM-Repositories, diesen übernimmt pulp
SSL-verschlüsselte Kommunikation mittels Vertrauensstellung (nur mit pulp-Agent)
Zeitgesteuerte Synchronisierung von Repositories mit der jeweiligen externen Quelle
Einfaches Erstellen eigener Repositories
Verwaltung der Agents erfolgt dezentral (dazu gleich mehr)

Aufbau

Der pulp-Server läuft standardmäßig als WSGI im Apache httpd und nutzt als Datenbank eine MongoDB.

Zudem werden mit Qpid Message-Queues verwaltet, über welche die Kommunikation mit dem Agent statt findet.

Die Installation und Konfiguration wird in der Projekt-eigenen Dokumentation sehr gut beschrieben, weshalb hier nicht weiter darauf eingegangen werden soll.

Empfehlenswert ist es jedoch, die unter /var/lib/ gelagerten Verzeichnisse (mongodb, pulp) auf ein separates Volume mit entsprechend ausreichendem Platz zu verschieben. Dabei ist der erforderliche Speicherplatz natürlich sehr von den zu spiegelnden und abzulegenden Paketen abhängig. Die Datenbank benötigt in unserem Setup im Hause (bei ca. 30 Repos mit insgesamt ca. 75.000 Paketen) etwas über 2GB.

Desweiteren wird eine funktionierende Zertifikatsstruktur benötigt, bei der eine lokale oder offizielle CA vorhanden ist oder während der Konfiguration erstellt wird. Die Agents erhalten jeweils das CA-Zertifikat, mit welchem sie den Server verifizieren.

Die Verwaltung aller Repositories erfolgt mit dem Tool pulp-admin, während mit dem pulp-consumer auf dem Agent die Registrierung am Server und das Anbinden an die jeweiligen Repos statt findet. Die Anbindung wird damit nicht vom Server gesteuert, sondern “dezentral” von dem jeweiligen Agent. Man kann sich jedoch auf dem Server eine Liste der angebundenen Server ausgeben lassen: pulp-admin consumer list --detail

Vorteile

Die yum/dnf-Konfiguration wird automatisch gepflegt, wenn das Repo über den Agent angebunden wird
- Dies kann umgangen werden, wenn für ein Repo --serve-http=true gesetzt ist, dann ist die Nutzung ohne Agent möglich (dies hängt mit der Art der Verifizierung/Authentifizierung über SSL zusammen)
Es wird ein lokales Abbild eines Repo erstellt, womit die Daten im eigenen Rechenzentrum liegen -> schnellerer Zugriff
Die Synchronisierungsjobs können ausgesetzt werden (wichtig für die Planung von Wartungen, in welcher sich die Update-Quelle nicht verändern darf) -> entspricht in etwa einem “Repo-Freeze”
Man erhält ein zentrales Abbild darüber, welche Server welche Repositories überhaupt eingebunden haben (leider nicht, ob daraus auch Pakete bezogen wurden)
Das System ist sehr robust, einfach zu bedienen und es werden nur Änderungen gespiegelt, sodass der Traffic im laufenden Betrieb eher gering ausfällt
Umfangreiche REST-API

Nachteile

Es können keine Revisionen von Repositories abgebildet werden bzw. erfordert dies persönlichen Einfallsgeist
Ein zentralerer Ansatz wäre ggf. wünschenswert, bei welchem vom Server aus gesteuert werden kann, welche Repos ein Agent/Consumer erhält
Die CLI-Tools sind gut zu bedienen, jedoch ist die Ausgabe nicht anpassbar und damit schwer weiter zu verarbeiten; ein Ausweichen auf die API ist damit empfohlen
- Statistische Auswertungen sind damit nur mit erhöhtem Aufwand durchführbar

Hinweise und nützliche Kommandos

Repository mit externer Quelle erstellen

pulp-admin rpm repo create --repo-id pulp2-stable \
--display-name='Pulp 2 Production Releases - x86_64' \
--feed='https://repos.fedorapeople.org/repos/pulp/pulp/stable/2/7/x86_64/' \
--validate=true

pulp-admin rpm repo create --repo-id pulp2-stable \

--display-name='Pulp 2 Production Releases - x86_64' \

--feed='https://repos.fedorapeople.org/repos/pulp/pulp/stable/2/7/x86_64/' \

--validate=true

Falls das Repo bereits bei der Installation des Agents genutzt werden soll, bietet sich das Vergeben folgender Option an:

pulp-admin rpm repo update --repo-id pulp2-stable --serve-http=true
pulp-admin rpm repo publish run --repo-id pulp2-stable

1 2	pulp-admin rpm repo update --repo-id pulp2-stable --serve-http=true pulp-admin rpm repo publish run --repo-id pulp2-stable

Syncen der Pakete aus der Quelle auf die Disk

Vorher sollte der verfügbare Speicher geprüft werden.

pulp-admin rpm repo sync run --repo-id pulp2-stable

1	pulp-admin rpm repo sync run --repo-id pulp2-stable

Regelmäßige Synchronisation eines Repos

pulp-admin rpm repo sync schedules create --repo-id pulp2-stable -s 2017-01-01T04:00:00/P1DT

1	pulp-admin rpm repo sync schedules create --repo-id pulp2-stable -s 2017-01-01T04:00:00/P1DT

Mit -s wird der jeweilige Zeitintervall der Synchronisierung festgelegt. Das Schema basiert (teilweise) auf ISO 8601.

Obiges Beispiel führt die Synchronisierung jeweils täglich, um 4 Uhr morgens (lokale Zeitzone) aus. Beginnend ab dem 01.01.2017.

Nutzung eines Repositories auf dem Client

Auf dem Client/Consumer ist einfach folgendes auszuführen (installierter Agent vorausgesetzt):

pulp-consumer rpm bind --repo-id centos6-base
pulp-consumer rpm bind --repo-id centos6-updates

1 2	pulp-consumer rpm bind --repo-id centos6-base pulp-consumer rpm bind --repo-id centos6-updates

Dann dauert es nur einen kurzen Moment, bis der Consumer über das Queueing-System die Repository-Informationen bezogen hat, und es wird unter /etc/yum.repos.d ein repo-File angelegt.

Besonders Ungeduldige können mit einem service goferd restart nachhelfen.

Martin Schurz

Mit über 15 Jahren Erfahrung als System Engineer und System Architekt bin ich die “Allzweckwaffe” im Kampf gegen Bugs und Performanceprobleme. Den Rest meiner Arbeitszeit verwende ich zur Verbesserung unseres Monitoringsystems und des Netzwerks in unseren Rechenzentren.

Name	Cookie-Einstellungen
Anbieter	Deutsche Telekom MMS GmbH, Impressum
Zweck	Speicherung der Cookie-Einwilligungen, die beim Aufruf der Website gegeben wurden.
Datenschutzerklärung	https://www.telekom-mms.com/datenschutz.html
Host(s)	blog.telekom-mms.com
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Name	Mapp (ehem. Webtrekk)
Anbieter	Deutsche Telekom MMS GmbH
Zweck	Betrieb und bedarfsgerechte Gestaltung
Datenschutzerklärung	https://leistungen.telekom-mms.com/datenschutz.html
Host(s)	tsystems01.webtrekk.net
Cookie Name	WTEID_, WT_, WTSID_*
Cookie Laufzeit	6 Monate (Cookie), Bis zum Beenden des Browsers (Session Cookie)

Name	Social Media Funktionen
Anbieter	Deutsche Telekom MMS GmbH
Zweck	Ermöglicht es, die Social Funktionen auf der Webseite zu aktivieren, um Inhalte über Social Media zu teilen.
Datenschutzerklärung	https://blog.telekom-mms.com/datenschutzhinweise
Host(s)	blog.telekom-mms.com
Cookie Name	social, lokaler Speicher (blog.telekom-mms.com)
Cookie Laufzeit	1000 Tage (Cookie), Bis zum Löschen des Caches (lokaler Speicher)

Akzeptieren	soundcloud
Name	soundcloud
Anbieter	SoundCloud Limited
Zweck	Wird von SoundCloud eingesetzt, um registrierte Nutzer plattform- und geräteübergreifend zu erkennen
Datenschutzerklärung	https://soundcloud.com/pages/privacy
Host(s)	soundcloud.com, w.soundcloud.com
Cookie Name	sc_anonymous_id, Session Cookie (w.soundcloud.com), lokaler Speicher
Cookie Laufzeit	10 Jahre (Cookie), Bis zum Beenden des Browsers (Session Cookie), Bis zum Löschen des Caches (lokaler Speicher)