- Python: Get a File’s Extension (Windows, Mac, and Linux)
- Using Python Pathlib to Get a File’s Extension
- Как получить расширение файла из имени файла в Python?
- Способ 1: использование os.path.splitext()
- Способ 2: использование pathlib.Path()
- Способ 3: использование разделения строк
- Обработка пограничных случаев
- Заключение
- How to Get File Extension in Python
- Getting File Extension in Python
- Get File Extension using Pathlib Module
- Conclusion
Python: Get a File’s Extension (Windows, Mac, and Linux)
In this tutorial, you’ll learn how to use Python to get a file extension. You’ll accomplish this using both the pathlib library and the os.path module.
Being able to work with files in Python in an easy manner is one of the languages greatest strength. You could, for example use the glob library to iterate over files in a folder. When you do this, knowing what the file extension of each file may drive further decisions. Because of this, knowing how to get a file’s extension is an import skill! Let’s get started learning how to use Python to get a file’s extension, in Windows, Mac, and Linux!
The Quick Answer: Use Pathlib
Using Python Pathlib to Get a File’s Extension
The Python pathlib library makes it incredibly easy to work with and manipulate paths. Because of this, it makes perfect sense that the library would have the way of accessing a file’s extension.
The pathlib library comes with a class named Path , which we use to create path-based objects. When we load our file’s path into a Path object, we can access specific attributes about the object by using its built-in properties.
Let’s see how we can use the pathlib library in Python to get a file’s extension:
# Get a file's extension using pathlib import pathlib file_path = "/Users/datagy/Desktop/Important Spreadsheet.xlsx" extension = pathlib.Path(file_path).suffix print(extension) # Returns: .xlsx
We can see here that we passed a file’s path into the Path class, creating a Path object. After we did this, we can access different attributes, including the .suffix attribute. When we assigned this to a variable named extension , we printed it, getting .xlsx back.
This method works well for both Mac and Linux computers. When you’re working with Windows, however, the file paths operate a little differently.
Because of this, when using Windows, create your file path as a “raw” string. But how do you do this? Simply prefix your string with a r , like this r’some string’ . This will let Python know to not use the backslashes as escape characters.
Now that we’ve taken a look at how to use pathlib in Python to get a file extension, let’s explore how we can do the same using the os.path module.
Want to learn more? Want to learn how to use the pathlib library to automatically rename files in Python? Check out my in-depth tutorial and video on Towards Data Science!
Как получить расширение файла из имени файла в Python?
Извлечение расширения файла из имени файла — обычная задача в Python, особенно при работе со сценариями обработки файлов или автоматизации. Расширения файлов помогают определить тип файла и могут иметь решающее значение для правильной обработки файлов. В этой статье мы рассмотрим различные способы извлечения расширения файла из имени файла в Python.
Способ 1: использование os.path.splitext()
os module — один из наиболее часто используемых модулей для работы с файлами в Python. os.path.splitext() можно использовать для разделения имени файла на две части: имя и расширение.
import os file_name = "example.txt" name, extension = os.path.splitext(file_name) print(extension)
В этом примере os.path.splitext() разбивает имя файла на кортеж, где первый элемент — это базовое имя, а второй — расширение.
Вы можете увидеть вывод, когда я запускаю код в редакторе:
Способ 2: использование pathlib.Path()
pathlib представлена ли в Python 3 современная библиотека для более интуитивно понятной обработки путей к файлам? Path класс из pathlib имеет suffix свойство, которое можно использовать для получения расширения файла.
from pathlib import Path file_name = "example.docx" file_path = Path(file_name) extension = file_path.suffix print(extension) # Output: .txt
Здесь мы создаем Path объект, а затем использовать его suffix свойство, чтобы получить расширение файла. Этот метод часто считается более Pythonic и рекомендуется в современном коде Python.
Как только вы запустите код, вы увидите, что он даст расширение как .docx, как показано на снимке экрана ниже.
Способ 3: использование разделения строк
Хотя этот метод не так надежен, как упомянутые ранее, все же стоит упомянуть, что вы также можете использовать базовые операции со строками, чтобы получить расширение файла. Вы можете использовать split() и извлеките последнюю часть строки в качестве расширения.
file_name = "example.txt" extension = file_name.split('.')[-1] print(extension) # Output: txt
Обратите внимание, что этот метод не включает точку ( . ) в расширении. Кроме того, если имя файла не имеет расширения, этот метод не будет работать должным образом, поэтому он менее надежен по сравнению с другими методами.
Обработка пограничных случаев
Важно обрабатывать крайние случаи, такие как имена файлов без расширений или имена файлов, начинающиеся с точки.
import os file_name = "file_without_extension" _, extension = os.path.splitext(file_name) print(extension) # Output: "" file_name = ".hiddenfile" _, extension = os.path.splitext(file_name) print(extension) # Output: ""
Оба os.path.splitext() и pathlib.Path().suffix методы хорошо обрабатывают эти крайние случаи и возвращают пустую строку, если нет расширения.
Заключение
Извлечение расширений файлов из имен файлов в Python прост и может быть выполнен с использованием различных методов в Python. os.path.splitext() и pathlib.Path().suffix методы являются наиболее надежными и рекомендуемыми для этой задачи. Хотя можно использовать разбиение строк, оно не так надежно, и его следует использовать с осторожностью, особенно в производственном коде.
Вам также может понравиться:
Я Биджай Кумар, Microsoft MVP в SharePoint. Помимо SharePoint, последние 5 лет я начал работать над Python, машинным обучением и искусственным интеллектом. За это время я приобрел опыт работы с различными библиотеками Python, такими как Tkinter, Pandas, NumPy, Turtle, Django, Matplotlib, Tensorflow, Scipy, Scikit-Learn и т. д. для различных клиентов в США, Канаде, Великобритании, Австралии, Новая Зеландия и т. д. Проверьте мой профиль.
How to Get File Extension in Python
While we believe that this content benefits our community, we have not yet thoroughly reviewed it. If you have any suggestions for improvements, please let us know by clicking the “report an issue“ button at the bottom of the tutorial.
We can use Python os module splitext() function to get the file extension. This function splits the file path into a tuple having two values — root and extension.
Getting File Extension in Python
import os # unpacking the tuple file_name, file_extension = os.path.splitext("/Users/pankaj/abc.txt") print(file_name) print(file_extension) print(os.path.splitext("/Users/pankaj/.bashrc")) print(os.path.splitext("/Users/pankaj/a.b/image.png"))
Output:
- In the first example, we are directly unpacking the tuple values to the two variables.
- Note that the .bashrc file has no extension. The dot is added to the file name to make it a hidden file.
- In the third example, there is a dot in the directory name.
Get File Extension using Pathlib Module
We can also use pathlib module to get the file extension. This module was introduced in Python 3.4 release.
>>> import pathlib >>> pathlib.Path("/Users/pankaj/abc.txt").suffix '.txt' >>> pathlib.Path("/Users/pankaj/.bashrc").suffix '' >>> pathlib.Path("/Users/pankaj/.bashrc") PosixPath('/Users/pankaj/.bashrc') >>> pathlib.Path("/Users/pankaj/a.b/abc.jpg").suffix '.jpg' >>>
Conclusion
It’s always better to use the standard methods to get the file extension. If you are already using the os module, then use the splitext() method. For the object-oriented approach, use the pathlib module.
Thanks for learning with the DigitalOcean Community. Check out our offerings for compute, storage, networking, and managed databases.