Deploy a Scalable, Distributed File System Using GlusterFS (2024)

Un système de fichiers réseau distribué évolutif est adapté aux tâches gourmandes en données, comme le traitement d'images et la diffusion en continu de médias. Lorsqu'il est utilisé dans des environnements de calcul hautes performances (HPC), GlusterFS fournit un accès hautes performances aux jeux de données volumineux, en particulier aux fichiers immuables.

Architecture

Cette architecture de référence contient les composants d'infrastructure requis pour un système de fichiers réseau distribué. Il contient trois instances Bare Metal, qui représentent le minimum requis pour configurer la haute disponibilité pour GlusterFS.

Dans une configuration à trois serveurs, au moins deux serveurs doivent être en ligne pour permettre les opérations d'écriture sur le cluster. Les données sont répliquées sur tous les noeuds, comme illustré dans le diagramme.

Deploy a Scalable, Distributed File System Using GlusterFS (1)
Description de l'illustration glusterfs-oci.png

glusterfs-oci-oracle.zip

  • Région

    Une région Oracle Cloud Infrastructure est une zone géographique localisée qui contient des centres de données, appelés domaines de disponibilité. Les régions sont indépendantes d'autres régions et de grandes distances peuvent les séparer (dans les pays voire les continents).

  • Domaine de disponibilité

    Les domaines de disponibilité sont des centres de données autonomes et indépendants au sein d'une région. Les ressources physiques de chaque domaine de disponibilité sont isolées des ressources des autres domaines de disponibilité, ce qui assure la tolérance de pannes. Les domaines de disponibilité ne partagent ni infrastructure telle que l'alimentation ou le refroidissem*nt, ni réseau interne. Par conséquent, il est improbable qu'un problème affecte les autres domaines de disponibilité de la région.

  • Domaine de pannes

    Un domaine de pannes est un regroupement de matériel et d'infrastructures au sein d'un domaine de disponibilité. Chaque domaine de disponibilité comporte trois domaines de pannes avec une alimentation et un matériel indépendants. Lorsque vous distribuez des ressources entre plusieurs domaines de pannes, vos applications peuvent tolérer les pannes de serveur physique, la maintenance du système et les pannes d'alimentation au sein d'un domaine de pannes.

  • Réseau et sous-réseaux cloud virtuels

    Un VCN est un réseau personnalisable et défini par logiciel que vous configurez dans une région Oracle Cloud Infrastructure. Comme les réseaux cloud virtuels traditionnels, vous bénéficiez d'un contrôle total sur votre environnement réseau. Un VCN peut comporter plusieurs blocs CIDR qui ne se chevauchent pas et que vous pouvez modifier après avoir créé le VCN. Vous pouvez segmenter un VCN en sous-réseaux, qui peuvent être ciblés vers une région ou un domaine de disponibilité. Chaque sous-réseau se compose d'une plage contiguë d'adresses qui ne chevauchent pas les autres sous-réseaux du VCN. Vous pouvez modifier la taille d'un sous-réseau après sa création. Un sous-réseau peut être public ou privé.

    Cette architecture utilise deux sous-réseaux : un sous-réseau public pour créer la DMZ et héberger le serveur de bastion, et un sous-réseau privé pour héberger les noeuds GlusterFS.

  • Groupe de sécurité réseau

    Les groupes de sécurité réseau agissent en tant que pare-feu virtuels pour vos ressources cloud. Avec le modèle de sécurité Zero Trust d'Oracle Cloud Infrastructure, tout le trafic est refusé et vous pouvez contrôler le trafic réseau au sein d'un VCN. Un groupe de sécurité réseau se compose d'un ensemble de règles de sécurité entrantes et sortantes qui s'appliquent uniquement à un ensemble spécifié de cartes d'interface réseau virtuelles dans un seul VCN.

  • Liste de sécurité

    Pour chaque sous-réseau, vous pouvez créer des règles de sécurité qui indiquent la source, la destination et le type de trafic qui doivent être autorisés en entrée et en sortie du sous-réseau.

  • Noeuds GFS

    Voici les en-têtes GlusterFS, avec 1 To de stockage de blocs attaché à chaque instance.

  • /gfs-data

    Dans l'architecture de référence, le client monte le volume GlusterFS au point de montage /gfs-data, via lequel votre application accède au système de fichiers. Plusieurs serveurs peuvent accéder aux noeuds de tête en parallèle.

  • Bastion

    L'hôte de base est une instance de calcul qui sert de point d'entrée sécurisé et contrôlé vers la topologie en dehors du cloud. Le bastion est généralement provisionné dans une zone démilitarisée (DMZ). Il permet de protéger les ressources sensibles en les plaçant dans des réseaux privés inaccessibles directement depuis l'extérieur du cloud. La topologie possède un seul point d'entrée connu que vous pouvez surveiller et auditer régulièrement. Ainsi, vous pouvez éviter d'exposer les composants les plus sensibles de la topologie sans compromettre l'accès à ces composants.

Recommandations

Vos besoins peuvent être différents de ceux de l'architecture décrite ici. Utilisez les recommandations suivantes comme point de départ.

  • Architecture GlusterFS

    Cette architecture utilise des volumes GlusterFS répliqués ; les données sont répliquées sur tous les noeuds. Cette configuration offre la plus grande disponibilité des données, mais utilise également la plus grande quantité d'espace. Comme indiqué dans le diagramme d'architecture, lorsque File1 est créé, il est répliqué sur les noeuds.

    GlusterFS prend en charge les architectures suivantes. Sélectionnez une architecture adaptée à vos besoins :

    • Volumes distribués

      Cette architecture est la configuration GlusterFS par défaut et permet d'obtenir une taille de volume et une évolutivité maximales. Il n'y a pas de redondance des données. Par conséquent, si une brique du volume échoue, elle entraîne la perte complète des données.

    • Volumes répliqués

      Cette architecture est particulièrement utilisée lorsque la haute disponibilité est essentielle. Les problèmes de perte de données dus à des défaillances de briques sont évités en répliquant des données sur plusieurs briques. Cette architecture de référence utilise la configuration des volumes répliqués.

    • Volumes répliqués distribués

      Cette architecture est une combinaison de volumes distribués et répliqués qui permet d'obtenir des volumes de plus grande taille qu'un volume répliqué et une disponibilité supérieure à un volume distribué. Dans cette configuration, les données sont répliquées sur un sous-ensemble du nombre total de briques. Le nombre de briques doit être un multiple du nombre de répliques. Par exemple, quatre briques de 1 To chacune vous donneront un espace distribué de 2 To avec une réplication double.

    • Volumes entrelacés

      Cette architecture est utilisée pour les fichiers volumineux qui seront divisés en petit* morceaux et chaque bloc est stocké en brique. La charge est répartie entre les briques et le fichier peut être extrait plus rapidement, mais aucune redondance de données n'est disponible.

    • Volumes distribués entrelacés

      Cette architecture est utilisée pour les fichiers volumineux avec une distribution sur plus de briques. Le compromis avec cette configuration est que si vous souhaitez augmenter la taille du volume, vous devez ajouter des briques en multiples du nombre de bandes.

  • Formes de calcul

    Cette architecture utilise une forme Bare Metal (BM.Standard2.52) pour tous les noeuds GlusterFS. Ces instances de calcul Bare Metal disposent de deux cartes d'interface réseau physiques capables de propager le trafic sur 25 Gbits/s chacune. La deuxième carte d'interface réseau physique est dédiée au trafic GlusterFS.

  • Mode "block storage"

    Cette architecture utilise 1 To de stockage de blocs. Nous vous recommandons de configurer un gestionnaire de volumes logiques (LVM) pour que le volume augmente si vous avez besoin d'espace supplémentaire. Chaque volume de blocs est configuré pour utiliser des performances équilibrées et fournit des E/S par seconde 35K et 480 Mo/s de débit.

  • Réseau cloud virtuel

    Lorsque vous créez un VCN, déterminez le nombre de blocs CIDR requis et la taille de chaque bloc en fonction du nombre de ressources que vous prévoyez d'attacher aux sous-réseaux du VCN. Utilisez des blocs CIDR compris dans l'espace d'adresse IP privée standard.

    Sélectionnez des blocs CIDR qui ne chevauchent aucun autre réseau (dans Oracle Cloud Infrastructure, votre centre de données on-premise ou un autre fournisseur cloud) auquel vous souhaitez configurer des connexions privées.

    Après avoir créé un VCN, vous pouvez modifier, ajouter et supprimer ses blocs CIDR.

    Lorsque vous concevez les sous-réseaux, tenez compte de vos exigences en matière de flux de trafic et de sécurité. Associez toutes les ressources d'un niveau ou d'un rôle spécifique au même sous-réseau, ce qui peut servir de limite de sécurité.

  • Groupes de sécurité réseau

    Vous pouvez utiliser des groupes de sécurité réseau pour définir un ensemble de règles entrantes et sortantes qui s'appliquent à des cartes d'interface réseau virtuelles spécifiques. Nous vous recommandons d'utiliser des groupes de sécurité réseau plutôt que des listes de sécurité, car les groupes de sécurité réseau vous permettent de séparer l'architecture de sous-réseau du VCN des exigences de sécurité de votre application. Dans l'architecture de référence, toutes les communications réseau sont contrôlées par le biais de groupes de sécurité réseau.

  • Liste de sécurité

    Utilisez des listes de sécurité pour définir des règles entrantes et sortantes qui s'appliquent à l'ensemble du sous-réseau.

Remarques

  • Performances

    Pour obtenir les meilleures performances, utilisez des cartes d'interface réseau dédiées pour communiquer de l'application à vos utilisateurs et aux têtes de réseau GlusterFS. Utilisez la carte d'interface réseau principale pour la communication entre votre application et les utilisateurs. Utilisez la carte d'interface réseau secondaire pour communiquer avec les en-têtes GlusterFS. Vous pouvez également modifier les performances de volume pour le stockage par blocs afin d'augmenter ou de réduire les IOPS et le débit de votre disque.

  • Disponibilité

    Les domaines de pannes offrent la meilleure résilience au sein d'un domaine de disponibilité. Si vous avez besoin d'une disponibilité supérieure, envisagez d'utiliser plusieurs domaines de disponibilité ou plusieurs régions. Pour les charges de travail stratégiques, envisagez d'utiliser des volumes GlusterFS répartis par bandes.

  • Coût

    Le coût de votre déploiement GlusterFS dépend de vos exigences en matière de performances et de disponibilité du disque :

    • Vous pouvez choisir l'une des options de performances suivantes : performances élevées, performances équilibrées et faible coût.
    • Pour une plus grande disponibilité, vous avez besoin d'un plus grand nombre de noeuds et de volumes GlusterFS.

déploiement

Le code requis pour déployer cette architecture de référence est disponible dans GitHub. Vous pouvez extraire le code dans Oracle Cloud Infrastructure Resource Manager en un seul clic, créer la pile et la déployer. Vous pouvez également télécharger le code à partir de GitHub sur votre ordinateur, le personnaliser et déployer l'architecture à l'aide de la CLI Terraform.

  • Déployer à l'aide d'Oracle Cloud Infrastructure Resource Manager :
    1. Cliquez sur .

      Si vous n'êtes pas déjà connecté, entrez les informations d'identification de la location et de l'utilisateur.

    2. Consulter et accepter les conditions générales.
    3. Sélectionnez la région de déploiement de la pile.
    4. Suivez les invites affichées à l'écran et les instructions pour créer la pile.
    5. Après avoir créé la pile, cliquez sur Actions Terraform et sélectionnez Plan.
    6. Attendez que le travail soit terminé et vérifiez le plan.

      Pour apporter des modifications, revenez à la page Détails de la pile, cliquez sur Modifier la pile et apportez les modifications requises. Exécutez ensuite à nouveau l'action Plan.

    7. Si aucune autre modification n'est nécessaire, revenez à la page Détails de la pile, cliquez sur Actions Terraform et sélectionnez Appliquer.
  • Déployer avec l'interface de ligne de commande Terraform :
    1. Accédez à GitHub.
    2. Clonez ou téléchargez le référentiel sur votre ordinateur local.
    3. Suivez les instructions du document README.

Voir plus

  • Structure des meilleures pratiques pour Oracle Cloud Infrastructure
  • Documentation Oracle Cloud Infrastructure
  • Documentation GlusterFS

Journal des modifications

Ce journal répertorie les modifications importantes :

5 novembre 2021
  • Mise à jour de la section Déployer pour déployer la dernière révision de la pile dans GitHub directement vers Oracle Cloud Infrastructure Resource Manager en un seul clic.
  • Ajout de l'option de téléchargement des versions modifiables (.SVG et .DRAWIO) du diagramme d'architecture.
Juin 17, 2021 Mise à jour de la section Déployer pour inclure le déploiement automatique.
Deploy a Scalable, Distributed File System Using GlusterFS (2024)

FAQs

How do you deploy GlusterFS? ›

If you'd like to deploy GlusterFS automatically using Puppet-Gluster+Vagrant, have a look at this article.
  1. Step 1 – Have at least two nodes. ...
  2. Step 2 - Format and mount the bricks. ...
  3. Step 3 - Installing GlusterFS. ...
  4. Step 4 - Configure the firewall. ...
  5. Step 5 - Configure the trusted pool. ...
  6. Step 6 - Set up a GlusterFS volume.

What is GlusterFS used for? ›

Most of the functionality of GlusterFS is implemented as translators, including file-based mirroring and replication, file-based striping, file-based load balancing, volume failover, scheduling and disk caching, storage quotas, and volume snapshots with user serviceability (since GlusterFS version 3.6).

What is scalable distributed file system? ›

The Distributed File System (DFS) allows users to easily access and share files across multiple servers, increasing availability, performance, and scalability. DFS improves data access and dependability by offering characteristics such as location transparency, redundancy, and replication.

What is Linux gluster? ›

Gluster is a scalable, distributed file system that aggregates disk storage resources from multiple servers into a single global namespace.

Is GlusterFS faster than nfs? ›

In the random read test, GlusterFS has good performance at data transfer speed and bandwidth, resulting in higher iops than NFS and MooseFS. The high performance of iops causes the runtime value to be smaller, which means that in jobs that require random data reading, GlusterFS can complete it quickly.

What is the best filesystem for Gluster? ›

Typically, XFS is recommended but it can be used with other filesystems as well. Most commonly EXT4 is used when XFS isn't, but you can (and many, many people do) use another filesystem that suits you.

Is GlusterFS end of life? ›

In 2022, it was announced Red Hat Gluster Storage version 3.5 will be the final version and this particular commercial offering will reach end-of-life at the end of 2024.

Is GlusterFS reliable? ›

Pros and cons of GlusterFS
Pros of GlusterCons of Gluster
Good utilization of existing capacitiesCreation of a complex network structure
Increased reliabilityIncreased administrative effort during set-up
Network load distributionQuick network infrastructure is needed
1 more row
Jan 28, 2021

What are the three techniques for scaling distributed systems? ›

  • Here are some basic techniques:
  • Scale out: Increase the number of nodes. ...
  • Scale up: Increase the size of each node. ...
  • Here are some architecture design considerations that can make scaling possible. ...
  • Shared nothing: A shared-nothing architecture is one in w.
Aug 7, 2017

What is an example of scalability in a distributed system? ›

A scalable distributed system: a definition. For example, we could say that a system can grow by the number of users who are using or interacting with it. If a system that has 5,000 users working within it suddenly experiences an uptick in users and sees 50,000 users…well, that is certainly one kind of growth!

What is an example of a distributed file system? ›

A cloud-based distributed file system is a type of distributed file system that uses the internet to store and access data. Amazon S3, Microsoft Azure, and Google Cloud Storage are examples of cloud-based distribution file systems.

Who uses gluster? ›

Companies Currently Using GlusterFS
Company NameWebsitePhone
GEICOgeico.com(877) 832-0937
Erias Ventureseriasventures.com(443) 280-9008
Clarity Innovations, LLCclarity-innovations.com(877) 683-3187
Netskopenetskope.com(800) 979-6988
2 more rows

Is GlusterFS free? ›

GlusterFS is a software-defined storage platform, well suited for both the enterprise environment and personal use. It is open source and free, with paid support options available.

What hardware is needed for gluster? ›

Recommended Requirements

16 GB of available system RAM that is not being consumed by existing processes. One Network Interface Card (NIC) with bandwidth of at least 1 Gbps. An out of band management card to manage and monitor the Red Hat Gluster Storage Console node even when the server is down.

How do you deploy Apollo Federation? ›

Deploying with managed federation
  1. Confirm the backward compatibility of each change by running rover subgraph check in your CI pipeline.
  2. Merge backward compatible changes that successfully pass schema checks.
  3. Deploy changes to the subgraph in your infrastructure.
  4. Wait until all replicas finish deploying.

Is GlusterFS still supported? ›

In 2022, it was announced Red Hat Gluster Storage version 3.5 will be the final version and this particular commercial offering will reach end-of-life at the end of 2024.

How do I start a gluster service? ›

Starting and stopping glusterd manually
  1. To start glusterd manually, enter the following command: /etc/init.d/glusterd start.
  2. To stop glusterd manually, enter the following command: /etc/init.d/glusterd stop.

How does GlusterFS replication work? ›

Replication logic. AFR is the module (translator) in glusterfs that provides all the features that you would expect of any synchronous replication system: Simultaneous updating of all copies of data on the replica bricks when a client modifies it.

Top Articles
Most Affordable Pet Insurance | FreeAdvice.com
What Is A Pet Insurance Deductible And How Does It Work At The Vet? | Bankrate
Nybe Business Id
Craigslist Warren Michigan Free Stuff
Dr Doe's Chemistry Quiz Answer Key
What happens if I deposit a bounced check?
Roblox Developers’ Journal
Meg 2: The Trench Showtimes Near Phoenix Theatres Laurel Park
Sinai Web Scheduler
Legacy First National Bank
Rls Elizabeth Nj
Grand Park Baseball Tournaments
Whitley County Ky Mugshots Busted
Purple Crip Strain Leafly
Slope Unblocked Minecraft Game
Readyset Ochsner.org
Bad Moms 123Movies
Gem City Surgeons Miami Valley South
Vintage Stock Edmond Ok
3476405416
Foxy Brown 2025
Epguides Strange New Worlds
ABCproxy | World-Leading Provider of Residential IP Proxies
Empire Visionworks The Crossings Clifton Park Photos
How to Download and Play Ultra Panda on PC ?
Craigslist Org Appleton Wi
Jermiyah Pryear
Cb2 South Coast Plaza
Gunsmoke Tv Series Wiki
Craigslist Scottsdale Arizona Cars
Kaiser Infozone
Kokomo Mugshots Busted
Envy Nails Snoqualmie
Yoshidakins
Www Violationinfo Com Login New Orleans
oklahoma city community "puppies" - craigslist
Ukg Dimensions Urmc
Google Chrome-webbrowser
Has any non-Muslim here who read the Quran and unironically ENJOYED it?
Ferguson Employee Pipeline
Best Restaurants Minocqua
Dcilottery Login
Stewartville Star Obituaries
Danielle Ranslow Obituary
Busted Newspaper Mcpherson Kansas
Leland Nc Craigslist
Ghareeb Nawaz Texas Menu
Reilly Auto Parts Store Hours
Jimmy John's Near Me Open
The Machine 2023 Showtimes Near Roxy Lebanon
Headlining Hip Hopper Crossword Clue
Latest Posts
Article information

Author: Tish Haag

Last Updated:

Views: 6196

Rating: 4.7 / 5 (67 voted)

Reviews: 90% of readers found this page helpful

Author information

Name: Tish Haag

Birthday: 1999-11-18

Address: 30256 Tara Expressway, Kutchburgh, VT 92892-0078

Phone: +4215847628708

Job: Internal Consulting Engineer

Hobby: Roller skating, Roller skating, Kayaking, Flying, Graffiti, Ghost hunting, scrapbook

Introduction: My name is Tish Haag, I am a excited, delightful, curious, beautiful, agreeable, enchanting, fancy person who loves writing and wants to share my knowledge and understanding with you.