El cálculo para obtener la dimensión del objeto en la imagen no funciona

Estoy tratando de calcular las dimensiones de un objeto en una imagen. Esta es una imagen de muestra que tomé para obtener la altura de la camisa azul:

imagen de camisa azul

Estoy siguiendo las matemáticas de esta página con la respuesta de sastanin. ¿Cómo calculo la distancia de un objeto en una foto?

La altura real del objeto es de ~90 cm, por lo que X=0.9m. Tomé la imagen desde 92 pulgadas de distancia, así que d=2.3368m. Usé un teléfono Samsung note 4 para obtener la imagen. Tienen una distancia focal de 4,8 mm, por lo que f=4.8mm. También tienen 72ppi. Me envié la imagen por correo electrónico y la abrí en Photoshop, y medí la altura de los píxeles de la camisa azul, y llegó a 1690 píxeles.

Si lo convierto a mm usando el ppi, obtengo x=596.19mm.

Entonces, usando la ecuación, obtengo

(596.194444444/4.8)*2.3368 = 290.247328703que dice que la camisa mide ~290 m de altura.

Así que claramente hay algo mal con las matemáticas aquí. ¿Alguien sabe?

Datos EXIF:

ExifTool Version Number         : 10.01
File Name                       : 20160715_202056.jpg
Directory                       : .
File Size                       : 4.1 MB
File Modification Date/Time     : 2016:07:15 22:12:49-04:00
File Access Date/Time           : 2016:07:15 22:13:05-04:00
File Inode Change Date/Time     : 2016:07:15 22:13:02-04:00
File Permissions                : rw-r--r--
File Type                       : JPEG
File Type Extension             : jpg
MIME Type                       : image/jpeg
Exif Byte Order                 : Little-endian (Intel, II)
Make                            : samsung
Camera Model Name               : SM-N910W8
Orientation                     : Rotate 90 CW
X Resolution                    : 72
Y Resolution                    : 72
Resolution Unit                 : inches
Software                        : N910W8VLU1DPE2
Modify Date                     : 2016:07:15 20:20:55
Y Cb Cr Positioning             : Centered
Exposure Time                   : 1/10
F Number                        : 2.2
Exposure Program                : Program AE
ISO                             : 400
Exif Version                    : 0220
Date/Time Original              : 2016:07:15 20:20:55
Create Date                     : 2016:07:15 20:20:55
Components Configuration        : Y, Cb, Cr, -
Shutter Speed Value             : 1/10
Aperture Value                  : 2.2
Brightness Value                : -1.35
Exposure Compensation           : 0
Max Aperture Value              : 2.2
Metering Mode                   : Center-weighted average
Light Source                    : Unknown
Flash                           : No Flash
Focal Length                    : 4.8 mm
User Comment                    : .
Flashpix Version                : 0100
Color Space                     : sRGB
Exif Image Width                : 5312
Exif Image Height               : 2988
Interoperability Index          : R98 - DCF basic file (sRGB)
Interoperability Version        : 0100
Sensing Method                  : One-chip color area
Scene Type                      : Directly photographed
Exposure Mode                   : Auto
White Balance                   : Auto
Focal Length In 35mm Format     : 31 mm
Scene Capture Type              : Standard
Image Unique ID                 : H16USHH04SA
GPS Version ID                  : 2.2.0.0
Compression                     : JPEG (old-style)
Thumbnail Offset                : 3318
Thumbnail Length                : 7352
Image Width                     : 5312
Image Height                    : 2988
Encoding Process                : Baseline DCT, Huffman coding
Bits Per Sample                 : 8
Color Components                : 3
Y Cb Cr Sub Sampling            : YCbCr4:2:0 (2 2)
Aperture                        : 2.2
Image Size                      : 5312x2988
Megapixels                      : 15.9
Scale Factor To 35 mm Equivalent: 6.5
Shutter Speed                   : 1/10
Thumbnail Image                 : (Binary data 7352 bytes, use -b option to extract)
Circle Of Confusion             : 0.005 mm
Field Of View                   : 60.3 deg
Focal Length                    : 4.8 mm (35 mm equivalent: 31.0 mm)
Hyperfocal Distance             : 2.25 m
Light Value                     : 3.6
ok, adjunto enlace a la imagen original

Respuestas (4)

PPI no tiene nada que ver con el cálculo. Calculo que las dimensiones del sensor de 1/2,6" del Note 4 son aproximadamente 5,80 mm × 3,27 mm. Entonces, usando 5,80 mm como altura del sensor (la imagen está en orientación vertical, por lo que necesitamos la dimensión larga del sensor para la altura de la imagen) en la ecuación en la respuesta de Matt Grum en la pregunta a la que se vinculó, y reorganizando la ecuación para resolver la 'altura real ( mm )',

ingrese la descripción de la imagen aquí

Lo cual concuerda con la altura de tu chaqueta de ~90 cm.

Te estás perdiendo algo grande. No se menciona el tamaño del sensor de la cámara. Necesita saberlo, tanto en mm como en píxeles. No dijiste ningún tamaño, pero Samsung dice 3,7 megapíxeles, así que si es 4:3, eso es 2221 x 1666 píxeles. Las especificaciones de Samsung no lo dicen. Sin embargo, su imagen tendrá este tamaño, puede conocer sus dimensiones en píxeles.

El sensor mm es bastante difícil de determinar en la mayoría de los teléfonos. A lo sumo, el Samsung Note 4 dice que es un sensor de 1/2,6", pero este es un número falso, no una dimensión real de nada. Wikipedia dice que un Nokia de 1/2,5" mide 5,76 x 4,29 mm, pero eso no es realmente útil . Sin embargo, todo lo que sabemos.

No estoy seguro de lo que está tratando de calcular, parece saber tanto el tamaño del objeto como su distancia. La fórmula que encontraste calcula la distancia, no el tamaño. Aquí hay una calculadora que también calcula la distancia, no el tamaño. http://www.scantips.com/lights/subjectdistance.html

Ambos requieren conocer el tamaño del sensor, en mm y en píxeles. Si conocía el factor de recorte, la calculadora puede calcular el tamaño del sensor en mm. Sin embargo, me atrevo a decir que esto también se desconoce.

Altura del sensor 4,29 mm
Distancia focal 4,8 mm
Tamaño del sensor 1667 píxeles
Tamaño del sujeto 596 píxeles
Altura del sujeto 0,9 metros

Entonces Sujeto Distancia 2.82 metros

Así que estos números al conectar sus números y mis conjeturas, calcula la distancia como 2,82 metros, que usted dijo que eran 2,3 metros. Parece medio cerca, ya que no sabemos los números.

Esto funciona mejor con cámaras más grandes para las que conocemos las especificaciones.

EDITAR: Su Exif detallado ayuda.

Dice Tamaño de imagen: 5312x2988
Megapíxeles: 15,9
Distancia focal: 4,8 mm (equivalente en 35 mm: 31,0 mm)

Ya no son 3,7 megapíxeles. :) Y 5312x2988 es un aspecto de 1,78 (HDTV). Entonces, la calculadora dice que el factor de recorte de la videocámara es de 31/4,8 = 6,48x (en comparación con una película de 35 mm). Conocemos el tamaño de 35 mm, por lo que al usar diagonales, calcula que la altura del sensor es necesariamente de 5,84 mm de altura.

Otras fuentes dicen que Samsung 1 / 2.6 "es 5.5x4.1 mm (4: 3), cerca de los números de Scott (pero el suyo es 1.44: 1, ¿lo que puede ser un error tipográfico?). No sé dónde lo dice Samsung. Sin embargo, el tamaño de su imagen dice 5312x2988, que es 1.78: 1 HD, modo videocámara Esa imagen más ancha es necesariamente de menor altura.

De todos modos, a partir de eso, y corregido a la orientación vertical, calcula la altura del sensor (dimensión larga) como 5,84 mm y la distancia calcula 2,33 metros, usando los números que podemos adivinar.

http://www.scantips.com/g2/dist2.png

FWIW, el Exif dice 15,9 megapíxeles (5312x2988 es 15,872 megapíxeles).

Este 15.872 mp permite:

Relación de aspecto 1:1 / 3984 x 3984 píxeles = 15,872 mp

Relación de aspecto 4:3 / 4600 x 3450 píxeles = 15.870 mp

Relación de aspecto 3:2 / 4879 x 3253 píxeles = 15,871 mp

Relación de aspecto 16:9 / 5312 x 2988 píxeles = 15,872 mp

Pero 16:9 en un sensor de 15,87 mp 4:3 no puede ser más ancho que los chips de 4600 píxeles,
por lo que el modo de película 16:9 sería de 4600x2587 píxeles. Pero esta imagen es de 5312x2988, por lo que NO es un chip de 4:3. pero 15,87 mp solo puede ser un chip de videocámara 16:9.

Los comentarios no son para una discusión extensa; esta conversación se ha movido a chat .

@omega Esto es lo que no obtiene : la medida de 36x24 es el tamaño de un negativo fotográfico clásico tomado con una película de 35 mm.

Es una medida bien conocida y aceptada. La película de 35 mm fue una película muy utilizada durante más de 60 años. Debido a que el tamaño del formato (sensor o tamaño de la película) determina el ángulo de visión para una lente de distancia focal particular, y debido a que la película de 35 mm fue tan común durante tanto tiempo, muchos fotógrafos asocian una distancia focal particular cuando se usa con una película de 35 mm con un ángulo de visión particular.

La diagonal de 43,27 mm de un fotograma de una película de 35 mm dividida por la diagonal de cualquier sensor (o película) da el "factor de recorte" de la cámara.

  • Si el EXIF ​​da la distancia focal real de la lente y también da la distancia focal equivalente (35 mm) de la lente, dividir el EFL por el FL le dará el "factor de recorte" de la cámara.
  • A continuación, puede dividir la diagonal de 43,27 mm de un fotograma de película de 35 mm por el "factor de recorte" de la cámara para obtener la medida diagonal del sensor de la cámara.
  • Puede obtener la relación entre el ancho y el alto del sensor comparando el número de píxeles verticales y horizontales en la información EXIF ​​(Ancho de la imagen/Alto de la imagen)
  • Luego puede usar la trigonometría para derivar las medidas de las dimensiones verticales y horizontales del sensor porque ahora conoce la longitud de la diagonal del triángulo rectángulo formado por la longitud, la altura y la diagonal del sensor y conoce la relación entre el ancho y altura del sensor.

Dibujamos una línea imaginaria desde la parte superior e inferior del objeto hasta el centro de la lente. Esto traza la imagen de un triángulo. La base del triángulo es la distancia, objeto a lente. La base de este triángulo es la altura del objeto = 90 cementers X 10 = 900mm.

La altura de este triángulo es la distancia de la lente al objeto = 92 pulgadas = 92 X 25,4 = 2336,8 mm.

La razón de base a altura = 900 ÷ 2326.8 = 0.3851.

La imagen del objeto proyectada por la lente sobre el sensor de imagen forma un triángulo similar.

La altura de este triángulo es la distancia focal de la lente = 4,8 mm. La altura de la imagen tiene exactamente la misma proporción que la de 0,3851.

La altura de la imagen de la imagen proyectada = 4,8 X 0,351 = 1,8487 mm.