Php байты в строку

How can I convert array of bytes to a string in PHP?

But the most advisable alternative could be to use pack(«C*», [$array. ]) , even though it requires a funky array workaround in PHP to pass the integer list:

$str = call_user_func_array("pack", array_merge(array("C*"), $bytes))); 

That construct is also more useful if you might need to switch from bytes C* (for ASCII strings) to words S* (for UCS2) or even have a list of 32bit integers L* (e.g. a UCS4 Unicode string).

@alex: I’m okay with the whole badge chasing thing, but these kind of strategies shouldn’t be allowed. Changing the title to please search engines while improving a bit a bad and simple question is one thing, but bounty? Seriously.

@Alix Isn’t one of the goals of the site to give good results for search engines, to knock off Experts Exchange, W3 Schools, etc? And what is so bad with a bounty? I’ve always wanted to place one on someone else’s question, and I thought this was a good opportunity. The question itself isn’t that bad, obviously the OP could of made some effort on their behalf, but it is still a decent question. Do you have the same objection to this recent bounty ?

@alex: I’ve nothing against the edit (just the fact that you publicly advertised that you did it for the bump), but the point of a bounty is to attract attention on questions that still have no accepted solution. In this case, the question is crappy and subjective, and the solution had already presented itself 2 months ago in the form of a perfectly good and valid one-liner. The fact that you haven’t even awarded the bounty yet just reflects your true (SEO) purpose. If you do this, at least try not to be so obvious — the last thing I want is copycats using SO tools for the wrong purposes.

Читайте также:  Php массив в формат json

@Alix Axel. I’ve taken offense a few weeks ago when someone else offered a bounty himself after already aquiring the accepted answer (disguised repwhoring with a fairly stupid opinion post no less). It’s not quite the same here. While it’s already answered workably, there are a few more options. Some funny answers are still possible — two of which *I* dare not mention on SO. — Also not sure if anyone will bother, but I’m certain @alex would put the attention award (which is all the bounty system shall do) on something more interesting if it comes along.

The ‘call_user_func_array()’ should really be replaced by the Argument unpacking via ‘. ‘ see: php.net/manual/en/migration56.new-features.php So the code would be pack(‘C*’. $bytes)

Источник

Array of bytes to UTF-8 string in PHP? [closed]

As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be supported by facts, references, or expertise, but this question will likely solicit debate, arguments, polling, or extended discussion. If you feel that this question can be improved and possibly reopened, visit the help center for guidance.

How can I convert an array of bytes into a UTF-8 string? I need this because I am extracting from a binary format.

have tried utf8_decode(pack(«C*», array_slice($data, $i, $j))), but that’s getting me nowhere 😉 im a little bit newbie at this php.

Yes, it might be different. But you need to show an actual example of how the encoding got mixed up by simple byte-as-char serializing. If you had UTF-8BE (not actually legal, but in absence of a better description from you) then it would require a pretty cumbersome workaround. (Don’t bother asking, too broad for SO as few people answer a shallow one-liner question like yours.)

1 Answer 1

A string is nothing more than an array of bytes. So a UTF-8 string is the very same as an array of bytes, except that in addition you know what the array of bytes represent.

So your input array of bytes needs one more additional information as well: the character set (character encoding). If you know the input character set, you can convert the array of bytes to another array of bytes representing an UTF-8 string.

The PHP method for doing that is called mb_convert_encoding() .

PHP itself does not know of character sets (character encodings). So a string really is nothing more than an array of bytes. The application has to know how to handle that.

So if you have an array of bytes and want to turn that into a PHP string in order to convert the character set using mb_convert_encoding() , try the following:

$input = array(0x53, 0x68, 0x69); $output = ''; for ($i = 0, $j = count($input); $i < $j; ++$i) < $output .= chr($input[$i]); >$output_utf8 = mb_convert_encoding($output, 'utf-8', 'enter input encoding here'); 

(Instead of the single example above, have a look at more examples at https://stackoverflow.com/a/5473057/530502.)

$output_utf8 then will be a PHP string of the input array of bytes converted to UTF-8.

Источник

pack

Упаковывает заданные аргументы в бинарную строку согласно формату в параметре format .

Идея этой функции была заимствована из Perl и все коды форматирования работают также. Однако, есть некоторые отсутствующие коды форматирования, как, к примеру, код формата Perl «u».

Необходимо иметь ввиду, что отличие между знаковыми и беззнаковыми значениями влияет только на unpack() функцию, тогда как функция pack() дает одинаковый результат для знаковых и беззнаковых кодов формата.

Список параметров

Параметр format задается в виде строки и состоит из кодов формата и опционального аргумента повторения. Аргумент может быть целочисленным, либо * для повторения до конца введенных данных. Для a, A, h, H число повторений определяет то, сколько символов взято от одного аргумента данных, для @ — это абсолютная позиция для размещения следующих данных, для всего остального число повторений определяет как много аргументов данных было обработано и упаковано в результирующую бинарную строку.

Работающие на данный момент форматы:

Символы форматов функции pack()
Код Описание
a Строка (string) с NUL-заполнением
A Строка (string) со SPACE-заполнением
h Hex-строка (Hex string), с нижнего разряда
H Hex-строка (Hex string), с верхнего разряда
c знаковый символ (char)
C беззнаковый символ (char)
s знаковый short (всегда 16 бит, машинный байтовый порядок)
S беззнаковый short (всегда 16 бит, машинный байтовый порядок)
n беззнаковый short (всегда 16 бит, порядок big endian)
v беззнаковый short (всегда 16 бит, порядок little endian)
i знаковый integer (машинно-зависимый размер и порядок)
I беззнаковый integer (машинно-зависимый размер и порядок)
l знаковый long (всегда 32 бит, машинный порядок)
L беззнаковый long (всегда 32 бит, машинный порядок)
N беззнаковый long (всегда 32 бит, порядок big endian)
V беззнаковый long (всегда 32 бит, порядок little endian)
q signed long long (всегда 64 bit, машинный порядок)
Q беззнаковый long long (всегда 64 bit, машинный порядок)
J беззнаковый long long (всегда 64 bit, порядок big endian)
P беззнаковый long long (всегда 64 bit, порядок little endian)
f float (машинно-зависимые размер и представление)
d double (машинно-зависимые размер и прдставление)
x NUL байт
X Резервирование одного байта
Z Строка (string) с NUL-заполнением (добавлено в PHP 5.5)
@ NUL-заполнение до абсолютной позиции

Возвращаемые значения

Возвращает бинарную строку, содержащую данные.

Список изменений

Версия Описание
5.6.3 Добавлены коды «q», «Q», «J» и «P» для поддержки 64-bit чисел.
5.5.0 Добавлен код «Z», работающий аналогично «a» для совместимости с Perl.

Примеры

Пример #1 Пример использования pack()

Полученная бинарная строка длиной 6 байт будет содержать последовательность байтов 0x12, 0x34, 0x78, 0x56, 0x41, 0x42.

Примечания

Необходимо отметить, что PHP сохраняет значения типа integer как знаковые с машинно-зависимым размером (C тип long). Все числа, переданные как integer , но выходящие за границы этого типа будут сохранены с типом float . При упаковке этих float как integer , они будут переданы с типом integer . Это может как совпадать, так и нет с заданным шаблоном.

Наиболее частым является случай, когда упаковываются беззнаковые числа типа integer . В системах, где integer имеет размер в 32 бита, число обычно передается по тому же шаблону, как если бы integer был беззнаковым (хотя, это зависит от определенных преобразований из знаковое в беззнаковое, согласно стандарту С). В системах, где тип integer имеет размер в 64 бита, тип float не имеет мантиссы, достаточной по размеру для хранения значения без потери точности. Если эти системы также имеют простой 64-битный С тип int (большинство UNIX систем не имеют), то единственным путем для использования формата I в верхнем разряде является создание отрицательных integer значений с тем же представлением как и в определенном беззнаковом значении.

Смотрите также

Источник

pack

Pack given arguments into a binary string according to format .

The idea for this function was taken from Perl and all formatting codes work the same as in Perl. However, there are some formatting codes that are missing such as Perl’s «u» format code.

Note that the distinction between signed and unsigned values only affects the function unpack() , where as function pack() gives the same result for signed and unsigned format codes.

Parameters

The format string consists of format codes followed by an optional repeater argument. The repeater argument can be either an integer value or * for repeating to the end of the input data. For a, A, h, H the repeat count specifies how many characters of one data argument are taken, for @ it is the absolute position where to put the next data, for everything else the repeat count specifies how many data arguments are consumed and packed into the resulting binary string.

Currently implemented formats are:

pack() format characters
Code Description
a NUL-padded string
A SPACE-padded string
h Hex string, low nibble first
H Hex string, high nibble first
c signed char
C unsigned char
s signed short (always 16 bit, machine byte order)
S unsigned short (always 16 bit, machine byte order)
n unsigned short (always 16 bit, big endian byte order)
v unsigned short (always 16 bit, little endian byte order)
i signed integer (machine dependent size and byte order)
I unsigned integer (machine dependent size and byte order)
l signed long (always 32 bit, machine byte order)
L unsigned long (always 32 bit, machine byte order)
N unsigned long (always 32 bit, big endian byte order)
V unsigned long (always 32 bit, little endian byte order)
q signed long long (always 64 bit, machine byte order)
Q unsigned long long (always 64 bit, machine byte order)
J unsigned long long (always 64 bit, big endian byte order)
P unsigned long long (always 64 bit, little endian byte order)
f float (machine dependent size and representation)
g float (machine dependent size, little endian byte order)
G float (machine dependent size, big endian byte order)
d double (machine dependent size and representation)
e double (machine dependent size, little endian byte order)
E double (machine dependent size, big endian byte order)
x NUL byte
X Back up one byte
Z NUL-padded string
@ NUL-fill to absolute position

Return Values

Returns a binary string containing data.

Changelog

Version Description
8.0.0 This function no longer returns false on failure.
7.2.0 float and double types supports both Big Endian and Little Endian.
7.0.15,7.1.1 The «e», «E», «g» and «G» codes were added to enable byte order support for float and double.

Examples

Example #1 pack() example

The resulting binary string will be 6 bytes long and contain the byte sequence 0x12, 0x34, 0x78, 0x56, 0x41, 0x42.

Notes

Note that PHP internally stores int values as signed values of a machine-dependent size (C type long ). Integer literals and operations that yield numbers outside the bounds of the int type will be stored as float . When packing these floats as integers, they are first cast into the integer type. This may or may not result in the desired byte pattern.

The most relevant case is when packing unsigned numbers that would be representable with the int type if it were unsigned. In systems where the int type has a 32-bit size, the cast usually results in the same byte pattern as if the int were unsigned (although this relies on implementation-defined unsigned to signed conversions, as per the C standard). In systems where the int type has 64-bit size, the float most likely does not have a mantissa large enough to hold the value without loss of precision. If those systems also have a native 64-bit C int type (most UNIX-like systems don’t), the only way to use the I pack format in the upper range is to create int negative values with the same byte representation as the desired unsigned value.

See Also

Источник

Оцените статью