Solution possible pour les «paniques du noyau» aléatoires au démarrage d'Arch Linux

Ce post est de montrer comment "résoudre" presque le problème des startups avec des erreurs Arch Linux. Quelque chose comme l'image suivante:

IMG_20140707_210559

Comme on peut le voir, nous voyons que c'est l'une des nombreuses «combinaisons» d'erreurs qui apparaissent aléatoirement lors du démarrage d'un système d'exploitation avec ce problème. Comme il est dit dans cette erreur, cela indique qu'il peut y avoir un problème dans le "matériel", cependant, comme nous le savons tous dans ce système d'exploitation, même les mauvaises astuces de ce qui n'appartient pas au système d'exploitation peuvent être résolues.

Donc, je vais décrire mon expérience de ce problème. D'après ce que j'ai pu vivre, le problème était uniquement Arch Linux ou une autre distribution que j'ai testée en externe, car avec n'importe quel ubuntu que j'avais installé ou testé, cela a commencé sans problème. Mais s'il essayait de déchirer le Arch Linux installé sur le disque dur, le problème était qu'il devait redémarrer environ 50 fois pour que le système d'exploitation démarre normalement et puisse l'utiliser.

Cela avait déjà un problème avec moi car je ne pouvais utiliser que l'ubuntu que j'avais installé pour le tester et je ne pouvais même pas faire la moitié des choses avec lesquelles je pouvais faire Arch Linux. J'ai donc décidé de résoudre ce problème et j'ai commencé à enquêter, à la recherche de fils de discussion qui avaient le même problème, ils ont également mentionné qu'il s'agissait d'une erreur matérielle et que c'était précisément le processeur, donc cela a commencé à m'inquiéter, alors je suis arrivé à ouvrez le PC et vérifiez ce qui se passait, cependant, cela n'a pas aidé.

Mais quelque chose qui m'a montré, que je ne devrais pas abandonner, c'est que si Ubuntu Je pourrais parce que Arch Linux non (peut-être Ubuntu c'est mieux que voûte…?). J'ai donc commencé à écrire des paramètres de démarrage dans le noyau de Arch Linux, des choses comme: lapic, nomce, intel_idle.max_cstate = 0, disable_cpu_apic, acpi_skip_timer_override, acpi = stric, clk, apm, noapic, acpi = oldboot, acpi-cpufreq, intel_pstate = désactiver, i8042.no coptydpi = 1, apm apm = copyds, acdtpi = 0, apm = copyds pci = nocrs, rhgb, acpi = force, pnpacpi = XNUMXff et d'autres encore… Tout cela a été recommandé dans les forums que j'ai lus.

Jusqu'à ce que je devais entrer la documentation des paramètres du noyau, ce que je recommande d'ailleurs: https://www.kernel.org/doc/Documentation/kernel-parameters.txt

Et j'ai trouvé un paramètre assez intéressant que pour le moment j'ai réussi à démarrer Arch Linux sans problème:

linux /boot/vmlinuz-linux root=UUID=fbefe36c-1712-4f3b-b3e3-3eac759d71c9 notsc nomce maxcpus = 0

Comme indiqué ici, ce paramètre limite l'utilisation à un processeur sans activer le mode de traitement symétrique. Au début, cela fonctionnait plutôt bien jusqu'à ce que j'utilise la commande pacman-Syyu; m'a jeté un core vidé o défaut de segmentation.

J'ai donc automatiquement remarqué qu'il se passait quelque chose d'étrange, alors j'ai commencé à exécuter d'autres processus jusqu'à ce que soudainement le système se fige complètement et ne fonctionne plus, jusqu'à ce que je le redémarre. J'ai donc fait la même opération, mais cette fois j'ai réussi à exécuter htop et cela m'a montré ce qui suit:

IMG-20140729-WA0001

Comme prévu, il n'a montré qu'un seul processeur, puisque l'autre l'avait désactivé, cependant, il m'a semblé très étrange pourquoi les programmes ont lancé faute de segmentation, et ne pouvait même pas démarrer l'environnement graphique; donc c'était quelque chose qui au moins me donnait plus d'espoir que si je définissais les paramètres du noyau dans un sens, il démarrerait mon Arch Linux comme toujours.

J'ai donc continué à essayer les autres paramètres que j'ai écrits dans la liste jusqu'à ce que je tombe sur celui-ci, qui est la meilleure solution pour le moment:

 linux /boot/vmlinuz-linux root=UUID=fbefe36c-1712-4f3b-b3e3-3eac759d71c9 notsc nomce isolcpus = 1

Ce paramètre fait quelque chose d'aussi simple que d'isoler (et non de désactiver) le deuxième cœur du processeur en traitement symétrique, c'est-à-dire que la charge de traitement est donnée à un seul cœur tandis que l'autre n'est que complémentaire. Ceci, bien que cela semble contradictoire, n'affecte pas autant les performances, car ce grand système d'exploitation était capable d'exécuter des applications de cette manière:

tester

linux_rlz_compiz

Donc, avec cela, le seul problème que j'ai observé qui se produit au moment du démarrage, est une ou deux paniques ou oops du noyau; mais comparé aux 50 fois que j'ai dû redémarrer précédemment, je peux le considérer comme une "solution de contournement". Pour le reste, jusqu'à présent cela m'a permis d'utiliser l'OS et d'écrire ce post que vous lisez en ce moment :-).

J'espère qu'ils t'aideront et ne sortiront pas de GNU / Linux, qui est le meilleur système d'exploitation qu'ils aient jamais inventé. Je le dis à coup sûr.


Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués avec *

*

*

  1. Responsable des données: Miguel Ángel Gatón
  2. Finalité des données: Contrôle du SPAM, gestion des commentaires.
  3. Légitimation: votre consentement
  4. Communication des données: Les données ne seront pas communiquées à des tiers sauf obligation légale.
  5. Stockage des données: base de données hébergée par Occentus Networks (EU)
  6. Droits: à tout moment, vous pouvez limiter, récupérer et supprimer vos informations.

  1.   Grégory Swords dit

    Information très intéressante. Je n'ai jamais eu ces paniques du noyau dans ArchLinux depuis les années que je l'utilise, mais il est bon de savoir quoi faire si à un moment donné le problème survient. Je vous remercie!

    1.    kik1n dit

      Quoi qu'il en soit, j'utilise Arch depuis longtemps (j'étais comme 1 an sans Arch) et sans panique du noyau.
      Merci pour le conseil.

    2.    c4explosif dit

      Très probablement, comme je l'ai mentionné dans le post, le problème vient du matériel, car dans ce que j'utilise arch, cela ne m'avait pas posé de problème de ce type non plus.

    3.    animé dit

      Un autre avec d'excellents résultats dans Arch. Je n'ai jamais eu de panique de noyau

    4.    brutBasique dit

      Plus de 2 ans avec GNU / Linux ... 2 ans déjà avec ArchLinux, jamais de panique du noyau .. 😉

    5.    Manuel de la source dit

      Je pense que les paniques du noyau sont davantage dues au matériel qu'à la distribution elle-même. Je n'ai jamais vu de noyau panique sur l'ordinateur portable que j'utilise maintenant, sauf une fois que j'ai mis un Ubuntu alpha dedans (et Arch Linux était là aussi depuis deux ans). D'un autre côté, dans un autre ordinateur portable que j'ai, toute distribution que je mets donne toujours la panique du noyau et une grande variété d'erreurs pour tous les goûts.

  2.   éliotime3000 dit

    Avec le noyau 3.14 sur Debian, j'ai rencontré le problème de panique du noyau, en plus que chaque fois que j'allume mon PC, j'obtiens un message "délai de connexion / déconnexion" (et aussi quand je l'éteint).

    1.    Amaury dit

      Cela m'est arrivé tant dans Fedora que dans Arch, mais je ne sais pas pourquoi, et comment je ne vois aucune différence puisque je n'ai pas passé de temps à enquêter ou à résoudre cela (si c'est un problème).

    2.    dasasd dit

      Je pense que la raison en est qu'ils sont compilés avec gcc 4.9

      http://libuntu.com/linus-torvalds-considera-que-la-version-4-9-de-gcc-es-una-pura-y-absoluta-mierda/

  3.   Tony dit

    Merci beaucoup pour l'info. Certaines des nombreuses choses dont nous pouvons nous vanter sont ce type de forum

  4.   manu dit

    Pourquoi cela arrive-t-il à Arch Linux? Peut-être que cela ne suffit pas avec les problèmes qui apparaissent fréquemment avec la lenteur ou l'accrochage du système atteignant le point de jeter le système à la frette.

    1.    animé dit

      Hey? De quoi parles-tu? o_O

    2.    Amaury dit

      Arch est une distribution KISS configurable à partir de la base du système d'exploitation lui-même, en quelques mots, si le système est lourd c'est parce que vous l'avez construit de cette façon, si le système a des erreurs c'est parce que vous les avez générées ou parce que vous ne l'avez pas Configurer quelque chose correctement.Arch wiki est assez complet, il y a quelques années il n'y avait pas beaucoup de sujets importants en espagnol, cela et le processus d'installation était beaucoup plus rude et un peu difficile, maintenant tout est un peu plus automatisé.
      Blâmer la distribution pour les erreurs de l'utilisateur est tellement… Windows (?).

      1.    jourara dit

        Blâmer la distribution pour les erreurs est cohérent, simplement parce que c'est la vérité. Après avoir eu un problème similaire avec Manjaro, j'ai essayé Arch, Antergos et une autre distribution inconnue (je ne me souviens plus du nom maintenant, désolé) que quelqu'un m'a recommandé en m'assurant que cela ne posait pas de problèmes, mais rien; ils le donnent tous. Dans OpenSuse, Fedora, Mint, Mageia et tous ceux que j'ai essayés par la suite, cela ne passe pas. Donc en ce qui me concerne, je n'ai pas d'autre choix que de penser que c'est la faute de la distribution. Mais bon, je ne le diabolise pas ou quoi que ce soit, en plus, ça me gêne de ne pas pouvoir utiliser quoi que ce soit basé sur Arch, parce que j'aime beaucoup ça, mais ce foutu problème m'en empêche. Je ne pense pas non plus qu'il s'agisse du matériel, car beaucoup d'entre nous qui nous arrivent ne sont pas arrivés avant d'utiliser le même putain. Eh bien, en fait ça doit être quelque chose lié au matériel, mais, pour revenir au même chose, si je n'ai fait aucun changement et que j'ai des problèmes avec le même équipement avec lequel je ne les avais pas auparavant, évidemment ce sera dû à un changement fait par Arch qui m'a foutu.

      2.    Juanfgs dit

        "Blâmer la distribution pour les erreurs des utilisateurs est tellement ... Windows (?)."

        Je vous dirais que blâmer les utilisateurs pour des erreurs de produit est tellement Apple. Honnêtement, j'y ai pensé mille fois, mais je ne vois pas l'avantage d'utiliser quelque chose dont les responsables se lavent essentiellement les mains, dans un but sérieux. Et je dis cela étant donné que le logiciel GPL est livré sans garantie.

        Vous pouvez dire ce que vous voulez mais si c'est le même cas des rapports de manque de signal vers l'iPhone et la réponse d'Apple "c'est que vous vous trompez" d'il y a plusieurs années. Si vous créez une distribution, vous voulez généralement fournir de la qualité et un support minimal, et la vérité est qu'Arch est essentiellement un système amateur, où vous voyez que ses développeurs s'amusent à emballer de nouvelles choses, mais ont peu d'intérêt à offrir un véritable support. . Chaque fois que je vois ce type de message, j'apprécie davantage le travail derrière la distribution que j'utilise.

        Et oui, c'est un problème logiciel s'il ne fonctionne pas, s'il cesse de fonctionner dans une mise à jour, ou si quelque chose du matériel tombe en panne. Qu'une distribution panique du noyau alors qu'une autre ne le fait pas ... eh bien, oui, il y a clairement une distribution qui fait les choses bien et une autre mal. Maintenant, si cela vous fait plaisir d'utiliser Linux dans le style des années 90 où nous devions recompiler le noyau à chaque fois que nous avons branché une nouvelle imprimante… voilà.

  5.   mario dit

    Le noyau est-il compilé par les développeurs? ou le vôtre?
    Les paniques du noyau sont générées lorsque certains composants n'ont pas été sélectionnés (AND) lors de la compilation ou que certains modules n'ont pas été activés pour prendre en charge certains matériels. Avec la pratique et la connaissance de votre matériel (vous devez ouvrir le PC et voir quelles marques de puces il possède), vous pouvez construire un noyau personnalisé (par chrootage). Si ubuntu et le CD d'installation d'Arch se trouvaient sur votre ordinateur, il y a quelque chose dans la compilation qui n'est pas activé.

    1.    c4explosif dit

      C'était le noyau stock de l'archlinux lui-même, des référentiels.

  6.   anonyme dit

    Le noyau que vous utilisez, il reste quelque chose que votre matériel n'aime pas, vous devez avoir une version rare d'une puce sur votre carte mère ou même un bug dans une puce (cela arrive généralement).
    Il peut s'agir d'une table corrompue dans votre bios acpi, il est normal que le chinois de garde ne calcule même pas bien la somme de contrôle de chaque table, ces messages apparaissent généralement avec $ dmesg -human au début du démarrage.
    Vous devriez également essayer une autre alimentation, lorsque le filtrage échoue, l'ondulation a tendance à provoquer de telles pannes.
    Tout d'abord, essayez de changer la source et voyez ce qui se passe, si cela reste le même, essayez de configurer un noyau en fonction de votre matériel, par la façon dont vous apprendrez à mieux connaître votre PC dans le processus.

    1.    c4explosif dit

      Merci pour les conseils. Au fait, c'est un ordinateur portable, je pense que je devrais changer la batterie. Mais je vois que ce que tu m'as dit peut m'aider.

  7.   Yukiteru dit

    La panique du noyau qui me rend encore fou est en partie la faute des nouveaux et de ma vieille carte intégrée nVidia 6150 SE, obsolète et très poussiéreuse (je veux dire en partie parce que; ils ont fait un excellent travail en supportant un univers de puces graphiques comme celles de nVidia, et tout cela, en utilisant uniquement la rétro-ingénierie, et le problème ne se produit que pour certaines cartes avec le chipset NV4E).

    Tout ce que vous avez à faire est de démarrer Openbox + Firefox et une catastrophe se produit (rien de plus beau que de voir une mosaïque en noir et blanc complètement aléatoire sur votre écran). Et je le chante depuis le noyau 3.6 dans Debian, Fedora, Archlinux, Slackware et maintenant re-vérifié à nouveau dans Gentoo (juste installé avec le noyau 3.12), je ne prends plus la peine de prendre un journal, au noyau ou de lui donner le temps de écrivez quelque chose qui ne soit pas des personnages absurdes.

    1.    anonyme dit

      Je vous donne la solution, un pc que j'ai avec gentoo et la vidéo nvidia intégrée se passe de la même manière avec le pilote nouveau, donc je n'avais pas d'autre choix que d'utiliser le pilote nvidia fermé, ma puce doit utiliser le pilote 304.123

      00: 0d.0 Contrôleur compatible VGA [0300]: NVIDIA Corporation C61 [GeForce 7025 / nForce 630a] [10de: 03d6] (rev a2) (prog-if 00 [contrôleur VGA])

      Vous devez patcher un fichier noyau avant de le compiler, s'il n'est pas patché le mode graphique refusera de démarrer.

      Les étapes sont:
      # nano -w /usr/src/linux-3.15.7-gentoo/drivers/acpi/osl.c
      Recherchez avec ctrl + w dans nano ce texte, acpi_os_wait_events_complete et nano vous amène à cette partie:

      void acpi_os_wait_events_complete (void)
      {
      flush_workqueue (kacpid_wq);
      flush_workqueue (kacpi_notify_wq);
      }
      EXPORT_SYMBOL (acpi_os_wait_events_complete);

      Le patch que vous devez ajouter est cette dernière ligne qui commence par EXPORT, ctrl + ou ctrl + x
      Ensuite, vous compilez le noyau, installez les modules, installez le noyau, générez les initramfs si vous en avez besoin, ajoutez le splash aux initramfs si vous utilisez splash, régénérez les entrées pour grub et enfin et surtout, vous devez reconstruire les modules qui ne proviennent pas du noyau ou du module propriétaire nvidia, sans cela, le mode graphique ne fonctionnera pas.

      # sélection de la liste des noyaux
      # sélectionnez l'ensemble du noyau x
      # cd / usr / src / linux
      # faire
      # faire modules_install
      # mount / boot
      # faire installer
      # dracut –hostonly »3.15.7-gentoo –force
      # splash_geninitramfs –verbose –res 1400 × 1050 –append /boot/initramfs-3.15.7-gentoo.img emerge-world
      # grub-mkconfig -o /boot/grub/grub.cfg
      # emerge @ module-rebuild
      # umount / boot
      # arrêt -r maintenant

      Si vous utilisez genkernel, vous corrigez simplement ce fichier et je comprends que genkernel se corrige tout seul.
      De plus, vous devez supprimer le support drm et les pilotes nvidia et autres puces vidéo du noyau afin qu'ils n'entrent pas en collision frontale avec le pilote nvidia fermé qui est installé en tant que module nvidia.
      Dans le cas de l'utilisation de bootsplash, vous devez inclure le pilote uvesa dans le noyau pour qu'il prenne en charge des résolutions d'écran élevées car le pilote nvidia fermé (si je me souviens bien) ne prend pas en charge plus de 800 × 600 dans le terminal tty1 «F1» de la botte.
      Je ne sais pas pour les autres distributions, mais je suppose que cela devrait fonctionner sur n'importe quelle distribution si ces étapes étaient effectuées, en gardant le changement d'émergence pour quoi que ce soit.

      Voici les directives que vous devez suivre, pour nvidia et uvesa:
      http://wiki.gentoo.org/wiki/NVidia/nvidia-drivers/es
      http://wiki.gentoo.org/wiki/Uvesafb

      1.    Yukiteru dit

        Merci pour l'info, mais j'ai résolu le problème précisément en passant aux propriétaires. Je me souviens que le pilote nVidia précédent (304.121) a également dû être patché lors du passage à 3.13 car il avait un problème dans la compilation du module (il n'y avait pas d'erreurs, mais le module a refusé de fonctionner) et tout aussi à cause de l'ACPI gestionnaire d'événements. Dans Debian, j'ai rencontré le problème et j'ai trouvé la solution aussi.

        https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=740097

    2.    jourara dit

      J'ai utilisé Manjaro comme exemple, mais j'ai déjà mentionné que la même chose m'est arrivée avec Arch et d'autres dérivés. Par conséquent, je crois que le problème est plus le leur que ceux qui sont touchés.

      Pd: Je n'ai pas pu répondre directement au message concerné car l'option de réponse n'apparaît pas ...

  8.   jourara dit

    Je suis précisément passé de Manjaro à Linux Mint car il se figeait au démarrage après la mise à jour vers une version après 0.8.9 (je ne me souviens plus laquelle). D'après ce que j'ai lu, cela se produit généralement sur les ordinateurs portables. Mon problème en question n'était pas le même que celui de cet article, je pense que j'en suis venu à la conclusion qu'il pouvait être lié à la gestion de l'énergie. Il y avait des gens qui ne se figeaient pas s'ils démarraient l'ordinateur portable alors qu'il était débranché. Pour le moment, je ne me souviens pas si cela m'a permis de toujours commencer sans problème, mais bien sûr j'ai pu le faire plus de fois au prix de prendre plus de temps pour le faire.
    Quoi qu'il en soit, à la fin j'ai abandonné et je suis passé à Fedora et Linux Mint.

    1.    c4explosif dit

      Par coïncidence, hier, j'ai essayé de le suspendre sans le chargeur et lors de la reprise, il s'est accroché et j'ai dû redémarrer.

  9.   Amaury dit

    C'est assez drôle, je suis avec Arch depuis quelques mois et je n'ai pas eu un seul Kernel Panic! Cela m'est arrivé avec Antergos (Arch avec un référentiel ajouté) de l'environnement live, mais là je le considère plus compréhensible. Cela pourrait-il être un problème avec la carte mère ou un module RAM défectueux? Je me souviens qu'il y a environ 2 ans, un module de RAM m'a causé plusieurs écrans bleus sous Windows et aussi plusieurs paniques du noyau! sur Mandriva. J'ai dû tester chaque mémoire à la fois entre le redémarrage et le redémarrage.

    1.    jourara dit

      C'est un problème Arch (qui traîne tous ses dérivés), car dans d'autres distributions, il n'y a pas de problèmes de ce type. Ce que je trouve embarrassant, c'est qu'à ce stade, ils ne l'ont pas résolu. C'est juste eux depuis des années! J'ai lu des problèmes similaires à partir de 2011. Je suis clair que c'est quelque chose qui va et vient au fur et à mesure de leur mise à jour, car en utilisant les versions 0.8.7, 0.8.8 et 0.8.9 sans les mettre à jour, rien ne se passe. À partir de là, tout va à la merde, et sûrement dans les anciennes versions, cela s'est aussi produit. Pourquoi cela n'arrive-t-il qu'à quelques-uns d'entre nous? Je ne sais pas, mais je ne pense pas que ce soit notre problème, mais celui d'Arch, car, comme déjà dit, d'autres distributions fonctionnent parfaitement. Je me suis déjà cassé les cornes en son temps pour trouver une solution, mais je me suis fatigué. Donc, autant que je suis désolé, je ne vais pas utiliser Arch.

      1.    Yukiteru dit

        Arch 0.8.7, 0.8.8 et 0.8.9? Je découvre qu'Arch utilise cette nomenclature de version.

        Serait-ce que vous utilisez Manjaro?

      2.    Yukiteru dit

        Ok, je me réponds en lisant votre commentaire précédent, et une chose est Manjaro et une autre est Arch.

        Le fait de blâmer une distribution pour un certain problème n'est pas non plus cohérent (pas vraiment cohérent), du moins dans mon cas, je ne peux pas blâmer le nombre de distributions que j'essaye pour le problème avec nouveau et ma carte nVidia 6150SE, car le problème est le MMIO manipulation du pilote et de la carte (le nVidia saura quoi réparer et des choses folles ils devront corriger ce détail). Le matériel peut également être le problème, et vous pouvez voir que dans n'importe quel système d'exploitation que vous utilisez (Windows, Linux, BSD), et dans mon expérience de réparation d'ordinateurs, j'ai vu des problèmes matériels très étranges (comme un PC qui refuse de démarrer sauf si vous changer l'emplacement de la mémoire, et lors de l'arrêt, vous devez répéter le processus), et je ne peux pas blâmer Windows et Debian pour cela.

  10.   raaussi7 dit

    J'ai eu une panique du noyau avec un live ubuntu 12.04

  11.   Ulises Bernal Pérez dit

    J'ai frénétique à mon PC portable sécurisé HP pavilion dm4, 8 Go de RAM, 500 de disque dur, il a plus de 5 ans d'utilisation. Je ne me souviens pas de la vitesse du microprocesseur, un Intel core i5, je pense à plus de 2 mhz.
    Je ne peux rien écrire sur l'écran du terminal. Je continuerai à chercher plus d'informations pour résoudre ce problème.